2014-11-24 94 views
0

我是python的新手,试图实现主题建模。我使用gensim在pything中成功实现了LDA,但是我无法给这些主题提供任何标签/名称。 我们如何命名这些主题?请帮助用python实现的最佳方式。 我的LDA输出有点像这样(请告诉我是否需要密码): -在Python中命名LDA主题

0.024 * research + 0.021 * students + 0.019 * conference + 0.019 * chi + 0.017 * field + 0.014 * work + 0.013 *学生+ 0.013 * hci + 0.013 *组+ 0.013 *研究人员 0.047 *研究+ 0.034 *学生+ 0.020 * ustars + 0.018 *代表性不足+ 0.017 *参与者+ 0.012 *研究员+ 0.012 *数学+ 0.012 *毕业生+ 0.012 *数学+ 0.012 *会议 0.027 *学生+ 0.026 *研究+ 0.018 *会议+ 0.017 *字段+ 0.015 *新+ 0.014 *参与者+ 0.013 *志+ 0.012 *机器人+ 0.010 *研究员+ 0.010 *学生 0.023 *学生+ 0.019 *机器人+ 0.018 *会议+ 0.017 *国际+ 0.016 *互动+ 0.016 *新+ 0.016 * ph.d。 + 0.016 * meet + 0.016 * ieee + 0.015 * u.s。 0.033 * research + 0.030 * flow + 0.028 * field + 0.023 * visualization + 0.020 * challenges + 0.017 * students + 0.015 * project + 0.013 * shape + 0.013 * visual + 0.012 * data 0.044 * research + 0.020 * mathematics + 0.017 * program + 0.014 * june + 0.014 * conference + 0.014 * - + 0.013 * mathematicians + 0.013 * meetings + 0.011 * field + 0.011 * mrc 0.023 * research + 0.021 * students + 0.015 * field + 0.014 * hovering + 0.014 * mechanisms + 0.014 * dpiv + 0.013 *空气动力+ 0.012 *不稳定+ 0.012 *会议+ 0.012 *蜂鸟 0.031 *研究+ 0.018 *数学+ 0.016 *程序+ 0.014 *流量+ 0.014 *数学家+ 0.012 *会议+ 0.011 *字段+ 0.011 * june + 0.010 * visualization * 0.010 * communities 0.028 * students + 0.028 * research + 0.018 * ustars + 0.018 * mathematics + 0.015 * underrepresented + 0.010 * program + 0.010 * encourage + 0.010 *'',+ 0.010 * participants + 0.010 * CON ference 0.049 *研究+ 0.021 *会议+ 0.021 *程序+ 0.020 *数学+ 0.014 *数学家+ 0.013 *场+ 0.013 * - + 0.011 *会议+ 0.010 *领域

回答

0

标签主题是主题完全不同造型。这里有一篇文章介绍了如何使用关键字提取技术(KERA)为主题添加有意义的标签:http://arxiv.org/abs/1308.2359