1. 本际云推荐 - 专业推荐VPS、服务器,IDC点评首页
  2. 云主机运维
  3. VPS运维

使用Scrapy框架爬取网页并保存到Mysql

使用Scrapy框架爬虫并保存到Mysql数据库中

尊敬的读者大家好,我是本际云服务器推荐网的小编小本本。接下来我将和大家分享使用Scrapy框架爬虫并保存到Mysql数据库中的方法。

使用Scrapy框架爬取网页并保存到Mysql

具体实现方法

首先,我们打开目标网站,使用xpath定位元素。接下来,创建一个Scrapy爬虫工程,在终端输入指令:“scrapystartprojecthuty”。

进入到“hpty/hpty/spiders”目录下创建一个爬虫文件,使用指令“scrapygenspidersww”,对整个爬虫工程相关的爬虫文件进行编辑。

编辑setting文件,将君子协议原本的True改为False,并打开被注释掉的代码。

编辑item文件,用来定义数据类型。

编辑最重要的爬虫文件,即“hpty”文件,使用xpath定位要爬取的数据,并将其保存到数据库中。

编辑pipelines文件,对保存数据到数据库的操作进行处理。

创建数据库和数据表,最后回到终端,输入指令“scrapycrawlsww”即可爬取目标网站并将数据保存到Mysql数据库中。

以上就是使用Scrapy框架爬虫并保存到Mysql数据库中的具体实现方法,希望对大家有所帮助。

原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/7253.html