1511#
Fuller 管理员 发表于 2026-1-11 21:54:08 | 只看该作者
2386263743 发表于 2026-1-11 21:43
前几天刚下载的最新版本,今天用又爬不了了,主页不滚动,采集完全部显示已停止,请问这个怎么解决 ...

采集微博的什么内容?使用了哪个微博采集工具?
举报 使用道具
1512#
2386263743 中级会员 发表于 2026-1-12 21:41:54 | 只看该作者
微博主页,微博博主主页采集工具
举报 使用道具
1513#
Fuller 管理员 发表于 2026-1-13 16:35:32 | 只看该作者
2386263743 发表于 2026-1-12 21:41
微博主页,微博博主主页采集工具

网页改版了。规则已经修改好了,可以用了
举报 使用道具
1514#
zailailol 新手上路 发表于 2026-3-8 12:52:59 | 只看该作者
能采集博文中的图片和视频吗?
举报 使用道具
1515#
Fuller 管理员 发表于 2026-3-8 15:23:29 | 只看该作者
zailailol 发表于 2026-3-8 12:52
能采集博文中的图片和视频吗?

能采集,但是要自己做采集规则,现成的快捷采集不下载图片和视频。

下载图片的教程如下,下载视频跟下载图片的操作方法一样,图片在网页上是img元素,视频是video元素:
https://www.gooseeker.com/doc/article-534-1.html
https://www.gooseeker.com/doc/article-536-1.html
https://www.gooseeker.com/doc/article-560-1.html
举报 使用道具
1516#
L_PBF33 新手上路 发表于 2026-3-16 03:51:30 | 只看该作者
请问可以在一个设定的时间范围内,(比如说2021年4月-6月超话数据)在采集吗?这个需要如何设置?!感谢!
举报 使用道具
1517#
Fuller 管理员 发表于 2026-3-16 09:00:53 | 只看该作者
L_PBF33 发表于 2026-3-16 03:51
请问可以在一个设定的时间范围内,(比如说2021年4月-6月超话数据)在采集吗?这个需要如何设置?!感谢! ...

是类似这样的超话吗?https://weibo.com/p/100808fc439d ... 21b8716/super_index
微博超话网站上没有时间筛选按钮,所以爬虫也做不了筛选
举报 使用道具
1518#
L_PBF33 新手上路 发表于 2026-3-16 20:10:54 | 只看该作者
Fuller 发表于 2026-3-16 09:00
是类似这样的超话吗?https://weibo.com/p/100808fc439dedbb06ca5fd858848e521b8716/super_index
微博超 ...

对,如果人工翻页 翻到大概的时间框架,然后让爬虫收集信息,这样是不是就可以排除时间框架之后的信息了?





举报 使用道具
1519#
Fuller 管理员 发表于 2026-3-16 22:05:48 | 只看该作者
L_PBF33 发表于 2026-3-16 20:10
对,如果人工翻页 翻到大概的时间框架,然后让爬虫收集信息,这样是不是就可以排除时间框架之后的信息了 ...

比如,你要爬第3页开始的5页数据,可以把第3页的链接添加到快捷工具,然后选择采集页数为5
举报 使用道具
1520#
L_PBF33 新手上路 发表于 2026-3-17 19:24:25 | 只看该作者
Fuller 发表于 2026-3-16 22:05
比如,你要爬第3页开始的5页数据,可以把第3页的链接添加到快捷工具,然后选择采集页数为5
...

好的,我只有最后一个问题,最多可以采集多少页?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简

热门用户

GMT+8, 2026-4-5 22:21