是否有一个简单的使用Java库,可以接受一个字符串并返回一组字符串,这是关键字/关键字。java关键字提取
它不必特别聪明,只需使用停用词和词干匹配关键字即可。
我正在查看KEA包http://code.google.com/p/kea-algorithm/,但我无法弄清楚如何使用他们的代码。
理想情况下,有一个简单的示例文件将是很好的。在此期间,我将着手编写这本书!
编辑:当我说我看不出如何弄清楚如何使用他们的代码,我的意思是我看不到一个简单的方法。独立的班级本身具有可以完成大部分工作的有用方法。
你是什么意思关键字/关键字句?像字符串内的正则表达式或其他东西? – 2011-05-07 04:38:10
否....搜索引擎可以识别的关键字,我想从新闻文章中提取关键词,并从不同的新闻网站获取类似文章的列表(我知道有很多现有的服务可以做到这一点......它只是一点乐趣和为我学习)。 – Ankur 2011-05-07 04:47:42
不错,我喜欢这个主意。你应该寻找/编写一个算法来计算字/词频率 – 2011-05-07 04:50:51