LDA 吉布斯采样时间复杂度怎样分析只想吐槽一句

只想吐槽一句，LDA是用来算每个文档话题分布的，如果将多个文档合成一个文档再使用LDA，LDA还有什么用。。。
■网友
单次迭代复杂度为O(K*N)，其中K是主题数，N是词的总数。要收敛，至少迭代1000轮，所以是比较慢的。把文本合并为一个？计算复杂度几乎不会减少（因为基本无关）。当然，最大的问题是，这样你就不能隔离每个文本的主题分布了，每个文本的主题分布相当于是一个上下文的抽象。而你想想，你把整个世界作为上下文，这样的LDA，估计都不如直接拿huffman编码生成文本来得实在。因为采样到后面，分布会比较稀疏，所以有不少优化的余地。典型情况下可以做到接近O(log(K)*N)的复杂度。另外还有plda这类利用并行的优化。
■网友
跟迭代次数、topic个数、词汇个数有关啊。看代码啊。。。后面的问题没看懂，你是要自己做数据方便测试吗。。。

LDA 吉布斯采样时间复杂度怎样分析

推荐阅读

东莞是什么(对东莞的赞美词怎么写)

鹿苑毛尖历史文化,2015年北港毛尖的价格

知识分子是怎么样谈恋爱的

|第五人格IVL夏季赛：Yue双四抓掌控全场！CPG战胜XROCK取得首胜

健康百科汇|你必须知道这些，重磅！糖尿病降糖标准变了

秀秀科技雷军称小米高管仅有15位暗示还会有？对于小米来说确实不算多

同煤之声|同煤集团各单位开展“夏送清凉”活动

白梦妍|《白鹿原》：将白孝文亲手推向深渊的鹿子霖，为何又要拯救他？

健康百科汇：这5种绿植家里有就赶紧扔掉，别看长得美，对健康可多坏处了

「豆芽炒肉」豆芽炒肉的做法是什么

金智英|真的有一群人，她们四海为家

【深圳市AR协会】有望加速行业发展进程，钟建辉：疫情下AR/VR认知度明显提升

三本能办北京户口不

小娱兒|范冰冰参加葬礼惨遭袭胸！当众发飙对其一顿猛踹，盘点那些怒怼狗仔的明星

#罗志祥#?刚走红就过气？\诸葛大力\离开了《爱情公寓5》，只能做网红

醉驾男遇查撒腿就跑！称：接到妻子电话必须回去

股权|央行：包商银行将被提起破产申请，对原股东的股权等依法清算

神说要唱歌|假面骑士01：永远无法回收的片头曲画面两个领便当两个换腰带

世界上最辣的辣椒是什么辣椒呢世界排名第一的辣椒百度百科

■自制牛奶蜂蜜美白面膜有哪些方法呢?