将爬取的数据保存到mysql中

佚名 8年前 (2018-10-18) Python 1813人围观抢沙发百度已收录

为了把数据保存到mysql费了很多周折，早上再来折腾，终于折腾好了

安装数据库

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

1、pip install pymysql(根据版本来装)

2、创建数据

打开终端键入mysql -u root -p 回车输入密码

create database scrapy (我新建的数据库名称为scrapy)

3、创建表

use scrapy;

create table xiaohua (name varchar(200) ,url varchar(100));

数据库部分就酱紫啦

4、编写pipeline

5、编写setting

6、编写spider文件

7、爬取数据保存到mysql

scrapy crawl xhwang

之前报错为2018-10-18 09:05:50 [scrapy.log] ERROR: (1241, 'Operand should contain 1 column(s)')

因为我的spider代码中是这样

附一张网上找到的答案

错误原因：item中的结果为{'name':[xxx,xxxx,xxxx,xxx,xxxxxxx,xxxxx],'url':[yyy,yyy,yy,y,yy,y,y,y,y,]},这种类型的数据

更正为6下面代码后出现如下会有重复

然后又查了下原因终于解决问题之所在

在图上可以看出，爬取的数据结果是没有错的，但是在保存数据的时候出错了，出现重复数据。那为什么会造成这种结果呢？

其原因是由于spider的速率比较快，scrapy操作数据库相对较慢，导致pipeline中的方法调用较慢，当一个变量正在处理的时候

一个新的变量过来，之前的变量值就会被覆盖了，解决方法是对变量进行保存，在保存的变量进行操作，通过互斥确保变量不被修改。

在pipeline中修改如下代码

完成以上设定再来爬取，OK 大功告成（截取部分）

扫码关注我们

微信号：SRE实战

拒绝背锅运筹帷幄

赞 0 赏分享

转载请注明 : 文章转载自小翔博客将爬取的数据保存到mysql中

本文标题：将爬取的数据保存到mysql中

本文链接：https://www.liuyixiang.com/post/23097.html

上一篇 : web自动化-窗口句柄及位置变化

下一篇 : Golang Gin 项目包依赖管理 godep 使用

评论列表暂无评论

发表评论

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29

将爬取的数据保存到mysql中

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

将爬取的数据保存到mysql中

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

User Login

帐号或密码错误,请重试.