2012-04-27 99 views
7

我想知道在Java中是否存在可以定义单词并找到单词的起源的API。我记得有一段时间找回了这个,看到“apache commons”,但我不确定。使用Java定义单词

因此,基本上,用户将能够输入一个词“溢出”,然后程序将能够定义这个词。所以我正在寻找一个可以定义单词和查找单词来源的API。所以“recherche”这个词的起源就是“法国”。

+1

您是否在寻找[引理(HTTP ://en.wikipedia.org/wiki/Lemma_%28morphology%29)的标记?你的问题有点含糊,你应该澄清你的后面 - 最好是用一个例子。 – amit 2012-04-27 14:45:09

+0

我补充说明。希望这个问题将不太模糊 – 2012-04-27 14:49:06

+1

Recherche也是一个德语单词,你应该意识到同一个单词可以以多种语言存在 – oers 2012-06-12 06:40:47

回答

8

WordNet会给你一半你正在寻找的东西:你可以查找一个词的定义。请注意,有几种WordNet for Java的实现:jwi,jaws,Dan Bikel's,WordnetAPI。其中一些可能更容易用于您的目的比jwordnet由miku(我只使用下巴jwi)建议。

注意:WordNet不会给你起源(AFAIK)。我不知道有这样的软件。

:你必须提供一个词的引理要能看它在字典中。这意味着如果您想在自由文本文档(可以包含变形表单)上自动执行此操作,则必须应用一些自然语言处理(NLP)技术。如果你走这条路线,我会建议GATE项目的Morph plugin

4

没有为词源网站:http://www.etymonline.com/

它给出结果: RECHERCHE 1722,从神父recherché“仔细寻找,”rechercher页“寻求。”常用19c。食物,风格等,来表示晦涩难懂的卓越。

不知道他们是否有API,但使用某种脚本来查询它。

因此找到一个检测“Fr.”的好方法。在上面的句子中。

干杯, 埃里克

2

你有没有找JWKTL

“维基是一个多语种的,基于Web的,免费的字典,辞典 和短语手册,设计为词法伴侣 维基百科。最近,它已被认为是自然语言处理应用前景的词汇 语义资源。”

利用这一点,你可以看到词的词源。