请问下一个主体中有两个整理箱,然后会导出2个Excel,我怎么让它只导出一个Excel啊?因为这些都是一个页面的数据

举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-5-5 14:58

沙发
驻在冰箱的企鹅菌 中级会员 发表于 2017-5-5 14:53:30 | 只看该作者
因为我需要爬很多类似网页的数据,自己合并太麻烦了
举报 使用道具
板凳
scraper 论坛元老 发表于 2017-5-5 14:54:41 | 只看该作者
不能自动变成一个excel 要自己去合并
除非你做规则的时候就写在一个整理箱里
合并参考教程《如何在excel中合并多层级采集结果


举报 使用道具
地板
驻在冰箱的企鹅菌 中级会员 发表于 2017-5-5 14:55:31 | 只看该作者
scraper 发表于 2017-5-5 14:54
不能自动变成一个excel 要自己去合并
除非你做规则的时候就写在一个整理箱里
合并参考教程《如何在excel中 ...

可是写在一个整理箱中dom节点就找不到了,不能复制样例了

举报 使用道具
5#
scraper 论坛元老 发表于 2017-5-5 14:56:39 | 只看该作者
驻在冰箱的企鹅菌 发表于 2017-5-5 14:55
可是写在一个整理箱中dom节点就找不到了,不能复制样例了

嵌套整理箱试试
如果只能分开两个整理箱 那就要你自己去合并

举报 使用道具
6#
shengchengx 金牌会员 发表于 2017-5-5 14:58:59 | 只看该作者
可以将两个Excel表格进行合并呢,具体可以使用excel的vlookup函数可以根据两张表的关联字段进行合并。操作可以参考《如何在excel中合并多层级采集结果》。
同一个规则下多个整理箱的关联字段可以用:clueid、fullpath、realpath,这三个是与网址线索一一对应的,各个字段说明请见《xml文件结构怎么看》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬网址做层级采集——以当当商品爬虫为例
  • 网络爬虫采集列表数据
  • UMAP的min_dist参数有什么作用?
  • UMAP的n_neighbors参数有什么作用?
  • HDBSCAN的min_samples和min_cluster_size参

热门用户

GMT+8, 2026-6-26 05:14