Scrapy - CrawlSpider爬虫

佚名 7年前 (2019-04-15) 随笔 1091人围观抢沙发百度已收录

思路：

从response中提取满足某个条件的url地址，发送给引擎，同时能够指定callback函数。

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

1. 创建项目

scrapy startproject  myspiderproject

2. 创建crawlSpider 爬虫

scrapy genspider -t crawl 爬虫名  爬取网站域名

3. 启动爬虫

scrapy crawl  爬虫名     # 会打印日志

scrapy crawl  爬虫名   --nolog

crawlSpider 的参数解析：

案例

需求：爬取csdn上面所有的博客专家及其文章的文章 Url地址：http://blog.csdn.net/experts.html 。

分析：

使用crawlSpider 的注意点：

补充知识点：

扫码关注我们

微信号：SRE实战

拒绝背锅运筹帷幄

赞 0 赏分享

本文标题：Scrapy - CrawlSpider爬虫

本文链接：https://www.liuyixiang.com/post/41652.html

评论列表暂无评论

发表评论