准备作主题模型LDA聚类,求训练语料

wiki有公开的下载,直接用就好了。维基百科:数据库下载
■网友
泻药,可以参考基于LDA主题模型聚类的亚马逊商品评论文本挖掘。
原文链接
http://tecdat.cn/?p=1474Home appliance industry and consumer upgrades quietly unfolded. This change in the market so that consumer expectations of household appliances is no longer just a simple function to meet, but more details of the experience and technological innovation.


准备作主题模型LDA聚类,求训练语料



准备作主题模型LDA聚类,求训练语料


▍Key Words:质量、智能

准备作主题模型LDA聚类,求训练语料


▍Key Words:生活品质

准备作主题模型LDA聚类,求训练语料


▍Key Words:娱乐休闲

准备作主题模型LDA聚类,求训练语料
【准备作主题模型LDA聚类,求训练语料】


准备作主题模型LDA聚类,求训练语料


▍Key Words:智能

准备作主题模型LDA聚类,求训练语料



准备作主题模型LDA聚类,求训练语料



■网友
英文数据集:20 Newsgroups : Home Page for 20 Newsgroups Data Set中文数据集:
搜狗的文本分类语料库:http://www.sogou.com/labs/dl/c.html

■网友
自己爬吧。。。
■网友
训练LDA模型需要的语料要求是什么。是不是一些文档就够?如果做相关领域的LDA,那训练集也需要用相关领域的吗?谢谢


    推荐阅读