一条信息可以保存为一个txt或html形式吗

AnswerDSL

抓取微博博文，有什么办法可以把抓取到的每一条博文以txt或html形式单独保存吗？现在抓取的信息都是按照一页一页的html存的。

AnswerDSL · 发表于 2016-11-10 10:40:05

如果是独立的博文，一个线索产生一条数据，就会按每一条博文以html形式单独保存。微博话题是一页一页采集的，相当于一页产生一个线索，所以抓取的信息都是按照一页一页的html存的。按单条或按页似乎不影响文本分析。

共 1 个关于本帖的回复最后回复于 2016-11-10 10:40

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页