2011-06-05 113 views
1

我正在寻找.net中的工具/ api,它可以粗略地提取句子中的关键词。例如,如果我有一篇标题为“PIX:世界上最薄的15英寸笔记本电脑,戴尔XPS 15z”的文章,我想提取关键字,例如, DELL,XPS 15z,笔记本电脑等,以便我可以在其他文章中搜索这些关键字并向用户展示类似的文章。提取.net中句子中关键字的工具/ API

任何建议表示赞赏。

回答

0

如果你想要做搜索文本和目前相关的文章,你可能会感兴趣的Lucene.NET 。它将索引一段文本并接受标准的搜索引擎式查询。它甚至会对搜索结果进行Google风格的呈现,例如突出显示文档中的搜索字词。

它比使用Tarkus提到的算法更有效,但它会解决更多的问题,并且不必编写自己的搜索引擎(这是一项不平凡的任务)。

0

您也可以在正则表达式中使用分组来提取戴尔的文字。