我正在寻找.net中的工具/ api,它可以粗略地提取句子中的关键词。例如,如果我有一篇标题为“PIX:世界上最薄的15英寸笔记本电脑,戴尔XPS 15z”的文章,我想提取关键字,例如, DELL,XPS 15z,笔记本电脑等,以便我可以在其他文章中搜索这些关键字并向用户展示类似的文章。提取.net中句子中关键字的工具/ API
任何建议表示赞赏。
我正在寻找.net中的工具/ api,它可以粗略地提取句子中的关键词。例如,如果我有一篇标题为“PIX:世界上最薄的15英寸笔记本电脑,戴尔XPS 15z”的文章,我想提取关键字,例如, DELL,XPS 15z,笔记本电脑等,以便我可以在其他文章中搜索这些关键字并向用户展示类似的文章。提取.net中句子中关键字的工具/ API
任何建议表示赞赏。
如果你想要做搜索文本和目前相关的文章,你可能会感兴趣的Lucene.NET 。它将索引一段文本并接受标准的搜索引擎式查询。它甚至会对搜索结果进行Google风格的呈现,例如突出显示文档中的搜索字词。
它比使用Tarkus提到的算法更有效,但它会解决更多的问题,并且不必编写自己的搜索引擎(这是一项不平凡的任务)。
您也可以在正则表达式中使用分组来提取戴尔的文字。
我一直在寻找这种工具还和我找到了这个网页http://termcoord.wordpress.com/about/testing-of-term-extraction-tools/free-term-extractors/
您可以从任何的工具选择。这帮助了我很多选择。