2014-11-04 43 views
2

OpenNLP能够从内容中提取关键字吗? 如果是,如何? 如果不是,我应该使用哪个工具?OpenNLP能够从内容中提取关键字吗?

我想自动标记内容。例如, 。

杰西卡查斯坦已透露,与奇迹发生了一个会议未​​公开的角色,虽然明星证实它不是Marvel队长。“我们已经谈到了将来调整我们的力量,”查斯坦告诉MTV她与工作室的关系。 “这就是我的事情......如果你将要在超级英雄电影中,你只有一次机会。” “你永远是那个角色。那么,为什么要制作一部超级英雄电影,并扮演无聊的平民呢?“可能提到Maya Hansen呢? “查斯坦一直被钢铁侠3的角色所吸引,最后因为日程安排的困难而辍学...... ”我不想说太多,“这位明星继续说道,”但是有一件事,角色成为未来......我就像'我明白,但我想现在就这样做'' 这个角色可能会是谁来解释,虽然查斯坦已经开始摒弃后来的传言说她在玩Marvel队长。

它应该被标记为“超级英雄”,“电影”。

OpenNLP能够做到这一点吗? 谢谢。

回答

1

OpenNLP能够为您提取命名实体。这意味着任何人,地点,组织等名称都可能被系统认可。

但是,您要查找的是关键字提取,您需要在其中标识说明文档的相关关键字。我会建议检查Alchemyapi.com 他们有模型来提取关键字,分类学,命名实体等等。唯一的问题是,免费版本每天只给你1000笔交易(这可能足以满足你的任务)