爬取全部的校园新闻,爬取全部的校园新闻

佚名 7年前 (2019-04-11) 随笔 1968人围观抢沙发百度已收录

爬取全部的校园新闻

改作业要求来源于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2941

一、要求：

1.从新闻url获取新闻详情：字典,anews

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

2.从列表页的url获取新闻url：列表append(字典) alist

3.生成所页列表页的url并获取全部新闻：列表extend(列表) allnews

*每个同学爬学号尾数开始的10个列表页

4.设置合理的爬取间隔

import time

import random

time.sleep(random.random()*3)

5.用pandas做简单的数据处理并保存

保存到csv或excel文件

newsdf.to_csv(r'F:\duym\爬虫\gzccnews.csv')

保存到数据库

import sqlite3
with sqlite3.connect('gzccnewsdb.sqlite') as db:
newsdf.to_sql('gzccnewsdb',db)

改作业要求来源于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2941

一、要求：

1.从新闻url获取新闻详情：字典,anews

2.从列表页的url获取新闻url：列表append(字典) alist

3.生成所页列表页的url并获取全部新闻：列表extend(列表) allnews

*每个同学爬学号尾数开始的10个列表页

4.设置合理的爬取间隔

import time

import random

time.sleep(random.random()*3)

5.用pandas做简单的数据处理并保存

保存到csv或excel文件

newsdf.to_csv(r'F:\duym\爬虫\gzccnews.csv')

保存到数据库

import sqlite3
with sqlite3.connect('gzccnewsdb.sqlite') as db:
newsdf.to_sql('gzccnewsdb',db)

扫码关注我们

微信号：SRE实战

拒绝背锅运筹帷幄

赞 0 赏分享

转载请注明 : 文章转载自小翔博客爬取全部的校园新闻,爬取全部的校园新闻

本文标题：爬取全部的校园新闻,爬取全部的校园新闻

本文链接：https://www.liuyixiang.com/post/31597.html

上一篇 : 栈混洗

下一篇 : 周鸿祎IOT发布会思考

评论列表暂无评论

发表评论

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29

爬取全部的校园新闻,爬取全部的校园新闻

爬取全部的校园新闻

一、要求：

一、要求：

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

爬取全部的校园新闻,爬取全部的校园新闻

爬取全部的校园新闻

一、要求：

一、要求：

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

User Login

帐号或密码错误,请重试.