我不知道是否StackOverflow覆盖NLP,所以我会给这个镜头。 我很想找到来自特定领域的两个词的语义相关性,即“图像质量”和“噪音”。我正在做一些研究,以确定相机的评论对于相机的特定属性是正面的还是负面的。 (如每个评论中的图像质量)。NLP:找到单词之间的语义相似性的任何简单而好的方法?
然而,并不是每个人都使用完全相同的措辞“影像质量”的帖子,让我出去看看是否有办法为我建立类似的东西:
“图像质量”,其中包括(“噪音”,“颜色”,“清晰度”等) 所以我可以把所有的一切都包装在一个大伞里。
我这样做是为了另一种语言,所以Wordnet不一定有帮助。不,我不为Google或Microsoft工作,因此我没有将人们点击行为的数据作为输入数据。
不过,我确实有大量的文字,POS标记,分段等
如果您可以详细说明您正在使用的数据以及您想要执行的确切任务,那将会非常有用。您是否试图将个别评论的内容分类为正面或负面?或者,您是否认为评论已被标记为正面或负面,并且您正在试图弄清楚相机的哪些属性会导致用户对产品的感受(例如,产品是由5颗星中的1颗给出的,用户在评论中提到'图像质量',所以你推断图像质量很差)? – dmcer 2010-03-14 06:46:56
糟糕。混淆NLP /自然语言处理与NLP /神经语言编程。我的错。 – 2010-03-14 07:48:46
1)我想找到术语的伞分类: 就像多个属性实际上属于同一类别(我想这是分类呢?)我只通过机器学习方法处理分类,我非常怀疑可以适用于NLP 2)我基本上想告诉我两个概念术语之间的相似性:“焦点”与“细节”应该高于“相机重量”与“闪光灯” – sadawd 2010-03-14 07:53:07