2010-12-07 126 views
6

剂量任何人知道任何好的库,在那里为.NET可以帮助拉出来的关键词自然语言的块。自然语言处理库

基本上,我想去掉停用词,而忽略时态,单复数,一般发现,在本质上是相同的话。

一些技能寻找同义词将是很好,尤其是如果它包括诸如业务/技术/非字典单词。

回答

4

我一直在寻找了一段时间了良好的自动标记库。我还没有找到一个具有所需功能的程序,但为了创建基本文本摘要和关键字列表,OpenTextSummarizer的C#端口并不算太差。

+0

看起来很有趣,我得调查一下我什么时候有点时间。谢谢 :-) – Ben 2011-01-21 10:25:43