本帖最后由 w228258549 于 2018-4-9 15:03 编辑

添加线索是提示添加成功,但是查看时还是只有做规则时用的网页?
做规则用的网页:https://www.google.com/search?hl ... 37....0.GMxp3Oh91dU
添加的网页:https://www.google.com/search?hl ... 72....0.J3LNR9ghnR4



举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2018-4-9 14:58

沙发
yangwenge 金牌会员 发表于 2018-4-9 14:58:12 | 只看该作者
是由于网址过长导致的,爬虫会判断重复线索进行去重,网址的前255个字符相同就会被判定为重复线索,自动去重。
可以将这种长网址转换成短网址后再添加,用百度搜索短网址就能找到相关的工具了。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬网址做层级采集——以当当商品爬虫为例
  • 网络爬虫采集列表数据
  • UMAP的min_dist参数有什么作用?
  • UMAP的n_neighbors参数有什么作用?
  • HDBSCAN的min_samples和min_cluster_size参

热门用户

GMT+8, 2026-6-26 16:48