为什么在去哪儿门票评论那里爬虫爬到第二页就不能爬了,自动结束了?规则按照平常翻页的制定的啊!
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2019-3-4 17:22

沙发
shenzhenuser1 版主 发表于 2019-3-4 14:17:16 | 只看该作者
是用快捷采集采的还是自己做的规则?
举报 使用道具
板凳
cassiechan 中级会员 发表于 2019-3-4 14:24:33 | 只看该作者
wangyong 发表于 2019-3-4 14:17
是用快捷采集采的还是自己做的规则?

自己做的
举报 使用道具
地板
cassiechan 中级会员 发表于 2019-3-4 14:24:59 | 只看该作者

规则名是:衡山去哪儿
举报 使用道具
5#
shenzhenuser1 版主 发表于 2019-3-4 16:54:57 | 只看该作者
cassiechan 发表于 2019-3-4 14:24
规则名是:衡山去哪儿

规则需要做以下修改
1,取消原来的样例复制映射
2,修改整理定位为偏好@class
3,选择第一条评论对应的div,也就是class='mp-comments-item'的div节点对整理箱顶节点做定位标志映射



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
cassiechan 中级会员 发表于 2019-3-4 17:22:54 | 只看该作者
wangyong 发表于 2019-3-4 16:54
规则需要做以下修改
1,取消原来的样例复制映射
2,修改整理定位为偏好@class

好的,谢谢~
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬网址做层级采集——以当当商品爬虫为例
  • 网络爬虫采集列表数据
  • UMAP的min_dist参数有什么作用?
  • UMAP的n_neighbors参数有什么作用?
  • HDBSCAN的min_samples和min_cluster_size参

热门用户

GMT+8, 2026-6-26 05:00