目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
关于微博展开全文
利用论坛里的帖子和教程做了下博主主页的爬取,但是展开全文这里还是没有搞定。; 第二个是在点击展开全文后,微博正文有两个内容,一个是展开前的,一个是展开后的,所以我就遵照有篇帖子里的办法用了自定义Xpath,爬取这两个内容,可是后来测试的时候发现,前一个内容一直都在爬取第一篇微博的内容,而后一个内容一直都是第一篇有展开全文的展开后的内容,后来我把Xpath最后的[1]去掉了,前一个内容就正常了,但是因为第一个问题的存在,所以展开全文后的内容一直没有。一级规则——微博展开全文 二级规则——微博爬取博文
微博展开全文和翻页
请问自己定义微博关键词搜索规则时,如何同时实现展开全文和翻页抓取??求指教
微博展开全文下的抓取
现在微博不限字数了,有很多微博总是有“展开全文”,然后以下内容不显示,不知道如何抓取展开以下的内容,请大神赐教!
微博爬取展开全文内容
我不知道怎么爬取有展开全文的内容,我的规则名称是suibe_wbfx1,恳请大佬帮我分析一下,支个招,感谢!
微博位置服务无展开全文
微博位置服务(签到采集-此地热议)无展开全文,导致部分位置信息爬取不到
采集豆瓣影评,怎样展开全文?
用集搜客豆瓣影评的快捷工具采集豆瓣影评的时候,没有展开全文。所以自己做规则抓取。要用连续点击动作,点击页面上的展开,可是一个页面上有20条影评,也是就是说要点击20个地方,要怎么做?还有第二级规则要怎么做,把所有的影评都展开后,会得到一个新的页面,对着这个页面做二级规则吗?要用样例复制吗?任务名: douban影评展开-第一级-点击 douban影评展开-第二级-展开
微博博文展开全文采集总是抓取出错
如题,在使用微博博文展开全文采集的时候,总有一半的网址显示抓取出错。重采失败之后显示全部抓取成功,但是打包的时候条数还是对不上(比如显示采集了200条,打包只有144条)。快疯了,救命
如何抓取微博的“展开全文”的内容?
请教各位大神,有的微博内容很长,后面有“展开全文”按钮,遇到这样的如何抓取微博的“展开全文”的内容?
【微博博文展开全部采集】#GooSeeker数据DIY#
[list] [*][b]标题[/b]:【微博博文展开全部采集】#GooSeeker数据DIY# [*][b]类别:社交[/b] [*][b]网站:[/b]微博 [*][b]采集字段:[/b]博主头像、博主id、博主、博主主页、博文、博文独立网址t=1][b][color=SeaGreen][u][i]数据DIY图文教程[/i][/u][/color][/b][/url
总是抓不到微博“展开全文”下的内容
现在微博不限字数了,有很多微博总是有“展开全文”,然后以下内容不显示,不知道如何抓取展开以下的内容,请大神赐教!
怎样采集微博“展开全文”后的完整数据?
怎样采集微博“展开全文”后的完整数据? [attach]8551[/attach]
怎样采集豆瓣影评展开全文后的数据
怎样采集豆瓣影评展开全文后的数据 [attach]11510[/attach]
微博展开原文
有什么办法可以在使用关键词高级搜索的同时展开原文吗?数据量比较大,重新爬取比较耗时耗力 查看源代码发现 展开原文是是一个新的p tag [attach]12256[/attach
想问一下集搜客能爬取微博话题展开全文吗
你好,想问一下集搜客能爬取微博话题展开全文吗? 就是我给一个话题的网址,它自己展开全文爬取所有内容这样
关于展开全部内容的问题
为什么模拟点击没有展开全部内容呢? 任务名:广州农村商业银行美篇2 [attach]12746[/attach]