我们将陆续发布一系列扩展模块,将逐步涵盖文本分类、主题分析、基于机器学习的其他文本分析,以及视频分析等等。
本贴为用户提供一个交流的地方,有什么问题就跟帖讨论。
目前已经发布的功能有:
后续还有更多功能将陆续发布。
其他使用方法:




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2026-6-15 13:21

沙发
xieyiw 新手上路 发表于 2025-5-31 15:35:50 | 只看该作者
怎么分析不了英文情感词
举报 使用道具
板凳
Fuller 管理员 发表于 2025-11-10 18:14:05 | 只看该作者
xieyiw 发表于 2025-5-31 15:35
怎么分析不了英文情感词

英文情感分析将在2025年11月底发布
举报 使用道具
地板
AI视频爬取 新手上路 发表于 2025-12-9 17:55:25 | 只看该作者
聚类分析的结果中,两个聚类内存在重复的词汇,请问应该怎么解决呢?
举报 使用道具
5#
Fuller 管理员 发表于 2025-12-10 10:59:40 | 只看该作者
AI视频爬取 发表于 2025-12-9 17:55
聚类分析的结果中,两个聚类内存在重复的词汇,请问应该怎么解决呢?

一个词不可能只属于一个类别,通常会为每个类别做贡献,只是对类别的贡献度会有不同。可以只看topN几个词,这些词重复的少
举报 使用道具
6#
Fuller 管理员 发表于 2026-4-3 11:53:35 | 只看该作者
分析大官微的微博话题最适合使用top2vec。该模型已经在GooSeeker分词扩展模块6.0.0版本支持了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
Fuller 管理员 发表于 2026-6-15 13:21:57 | 只看该作者
BERTopic主题聚类功能发布了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬网址做层级采集——以当当商品爬虫为例
  • 网络爬虫采集列表数据
  • UMAP的min_dist参数有什么作用?
  • UMAP的n_neighbors参数有什么作用?
  • HDBSCAN的min_samples和min_cluster_size参

热门用户

GMT+8, 2026-6-24 11:03