采集网址:http://vip.win007.com/AsianOdds_n.aspx?id=1258383使用样例复制采集数据,发现相邻两条数据RT节点间有多余RT,样例复制采集数据不对,求高人指点下这样的情况怎么做可以?小白谢过...

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2017-5-9 15:16

沙发
Fuller 管理员 发表于 2017-5-8 09:06:15 | 只看该作者
你存一下规则,我才能帮你诊断,我现在搜不到你的规则。

中间插入不想要的TR也没有关系,照样用第一和第二条做样例复制
举报 使用道具
板凳
hhyyq6 初级会员 发表于 2017-5-9 09:04:54 | 只看该作者
Fuller 发表于 2017-5-8 09:06
你存一下规则,我才能帮你诊断,我现在搜不到你的规则。

中间插入不想要的TR也没有关系,照样用第一和第二 ...

您好!请问我只要在客户端存规则就可以吗?还是要把规则附上来?谢谢

举报 使用道具
地板
hhyyq6 初级会员 发表于 2017-5-9 09:20:26 | 只看该作者
hhyyq6 发表于 2017-5-9 09:04
您好!请问我只要在客户端存规则就可以吗?还是要把规则附上来?谢谢

...

规则已存,麻烦您指点下

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
hhyyq6 初级会员 发表于 2017-5-9 09:21:23 | 只看该作者
Fuller 发表于 2017-5-8 09:06
你存一下规则,我才能帮你诊断,我现在搜不到你的规则。

中间插入不想要的TR也没有关系,照样用第一和第二 ...

规则已存,麻烦您指点下

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
Fuller 管理员 发表于 2017-5-9 10:02:05 | 只看该作者


你基本上都做对了,我做了如下改进,注意看三个红框
1,样例复制照样用第二个和第三个TR做映射,虽然第三个TR是没有内容的行,但是不能跳,一跳就会发生内容跳行
2,我用TD下的text做内容映射,只用直观标注不够精度,要用内容映射。内容映射的时候,可以精选某个DOM节点。我选用了TD下的text,这样,即使用第三个TR做样例复制,但是,第三个TR没有内容,所以,TD下没有text,就会被滤除
3,我为“公司”勾选了关键内容,那么凡是没有内容的,就不会采集

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
hhyyq6 初级会员 发表于 2017-5-9 15:15:54 | 只看该作者
非常感谢...我学着试试看
举报 使用道具
8#
hhyyq6 初级会员 发表于 2017-5-9 15:16:36 | 只看该作者
Fuller 发表于 2017-5-9 10:02
你基本上都做对了,我做了如下改进,注意看三个红框
1,样例复制照样用第二个和第三个TR做映射,虽然第三 ...

非常的感谢...我学着试试..
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • LDA主题分析模型到底是什么?
  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别

热门用户

GMT+8, 2026-4-9 19:23