2015-01-17 50 views
-1

我打算从tripadvisor获取一些评论数据,我希望能够提取酒店相关方面并为他们分配极性,并将它们分类为负面或正面。什么是方面级别情感分析的一些好工具/实践?

我可以使用哪些工具来实现此目的以及如何和从哪里开始?我知道有一些工具像GATE,斯坦福NLP,Open NLP等,但是我能够执行上述特定任务吗?如果是这样,请让我知道一个前进的方法。我打算使用Java作为编程语言的选择,并且希望使用一些API

另外,如果我继续使用基于规则的方法或使用经过训练的评论语料库的ML方法,那么还有其他一些方法彻底?

P.S:我是NLP新手,需要一些帮助才能继续前进。

回答

0

斯坦福CoreNLP有很多的功能在一个封装

  • POS标注器
  • NER型号
  • 情感分析
  • 分析器

但在Apache的OpenNLP包由

  • 句子探测器
  • POS恶搞
  • NER
  • 分块

但他们不具有内置的功能,找出情感极性所以,你必须将自己的代码传递给其他图书馆诸如此类SentiwordNet找出极性。

我用过的OpenNLP和斯坦福Core NLP。但是,对于这两种情况,您都需要修改关于餐馆域的情感语料库。

+0

真的有必要拥有一个语料库吗?有没有其他的资料可用?请原谅我的无知。我对所有这些概念都陌生 –

+0

您可能需要制作自己的语料库,除非您可以找到与您的特定文本域(酒店评论)非常相似的内容。您可以通过存储评论星评级映射来自动执行此操作。 –