设置了两个规则,第一级规则采集网页上的链接,第二级规则采集所链接的网页内容,但是链接有很多页所以在第一级规则设置了翻页采集,步骤应该没问题,但是显示自身翻页只爬出了第一页的链接,求解

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-3-30 21:52

沙发
ym 版主 发表于 2017-3-30 21:52:50 | 只看该作者
本帖最后由 ym 于 2017-3-30 21:54 编辑

直接测试你的第一级规则,翻页没有问题。
你说只翻了一页,要么是网速问题,要么你是用爬虫群采集,规则的调度设置了同一线索内翻页次数为1,这种情况要改为不限制就好了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬网址做层级采集——以当当商品爬虫为例
  • 网络爬虫采集列表数据
  • UMAP的min_dist参数有什么作用?
  • UMAP的n_neighbors参数有什么作用?
  • HDBSCAN的min_samples和min_cluster_size参

热门用户

GMT+8, 2026-6-26 03:30