2010-01-14 48 views
8

我正在为我正在进行的项目寻找各种NLP工具,现在我发现了最有用的斯坦福大学自然语言处理项目。自然语言解析工具:那里有什么,什么不是?

有谁知道是否还有其他工具可以用于语言扩展吗?

更重要的是,有没有工具不在那里?

最特别,我在找一个API,用于morphophoneme分析等

编辑:我是一个学术(学生在课题的研究)和我主要是寻找开源,或者至少,打开api项目。

+0

我之前问过一个更具体的问题,但是这个问题取代了它。 – 2010-01-14 03:01:13

+4

请指出您是否只对免费的东西感兴趣,或者如果您是学术型的。我们中的一些人出售这种东西,但我们知道对学者很好。 – bmargulies 2010-01-14 03:20:00

回答

6

我建议你看看下面的例子:

  1. 的ususal NLP库,例如Open NLPLingPipeNLTKGateUIMA。所有这些提供解析器和词干(即它们不会让你回到词的根源,但它的词根)。有些人还提供lemmatizers。
  2. 收集NLP工具的网站。这些只是其中的几个:计算语言学,Language Technology World协会的wikithe website of the compling dep. at Heidelberg University

我不知道一个工具,它返回一个词的词根的,但是,正如我所说,有stemmers和lemmatizers。对于词形变化,请尝试Tree TaggerMorpha。 Morphophonemic分析是一个术语,不足以让你得到你想要的。

一旦您更具体地了解您需要什么,您可以搜索Corpora List的档案或在那里发布问题。

3

NTLK是一个有趣的工具包,它允许构建基于NLP的应用程序。这可以用于需要例如POS标记或实现简单分类器或实体提取器的实际应用。

但是,我不确定什么是“语言版本”,但是这听起来像是可能超出基于NLTK的[容易]的东西。
完全解读这个问题,并且它对morphophonics的提及似乎证实了NLTK可能不会很好地满足OP的目的;就我所知,NTLK不提供处理文本的模块。不过,你可能想自己检查一下,因为NLTK是一个广泛和活跃的项目,并且可能在这个领域看到了最近的增加。

1

Maluuba刚刚向他们的自然语言处理器发布了一个API。它可在http://developer.maluuba.com

有三个库由Maluuba为它写:

Python库:https://github.com/maluuba/napi-python

Ruby库:https://github.com/maluuba/napi-ruby

Java库:https://github.com/maluuba/napi-java

对于它的威力的例子,以此查询为例可以提取:

>> client.interpret phrase: 'Set up a meeting with Bob tomorrow \ 
      night at 7 PM to discuss the TPS reports' 
=> 
    {:entities=> 
     { 
     :daterange=>[{:start=>"2012-11-15", :end=>"2012-11-16"}], 
     :title=>["meeting to discuss the tps reports"], 
     :timerange=>[{:start=>"12:00:00AM", :end=>"12:00:00AM"}], 
     :contacts=>[{:name=>"bob"}] 
     }, 
    :action=>:CALENDAR_CREATE_EVENT, 
    :category=>:CALENDAR 
    }