首页

51问答网 > 怎么让爬虫智能的爬取网页的文章内容

怎么让爬虫智能的爬取网页的文章内容

2025-03-06 18:28:46

推荐回答（1个）

回答1：

将网页page source 保存到数据库（mongodb）中，每次取得新的page source 和数据库中的page source 的hash 值是不是想等，如果不等表示有更新。这个判断有了，爬虫爬取时间策略就好办了。自己动手实现吧。

相关问答

最新问答

下列各项中不应征收消费税的是:A、公共汽车轮胎 B、啤酒 C、护肤护发品 D、高尔夫球及球具

中国铁建广场周围有那些公交车？

有一首歌:我以为，你的眼泪。是龙门镖局的歌，叫什么

太原到河北白鹿温泉玩要多少钱？有去过的帮帮忙，怎么省钱啊

为什么我用网易uu加速器玩lol一开始游戏就显示应用程序错误呢？

我在淘宝商城买了双耐克空军一号，不知道真假求高手鉴定啊。

我的歌华有线电视搜不到频道

日语的绫怎么读

哈尔滨科智创业投资管理有限公司怎么样？

tt语音怎么改年龄，在线等挺急的