2009-12-31 88 views
0

什么是一种智能的方式来存储文本,以便以后可以智能地解析和翻译。智能文本解析和翻译

例如,员工是优秀的,因为他可以找出自己的长处和短处以及熟悉自己。

上面可以是被示出为之前评价的用户通用的文字。如果用户是男性(比如肖恩)或女性(比如玛丽),则上述内容应翻译如下。

玛丽是优秀的,因为她可以找出自己的长处和短处以及熟悉自己。

肖恩是优秀的,因为他可以找出自己的长处和短处以及熟悉自己。

  1. 我们如何将评估标准与适当的地点或令牌持有者一起存储在第一位。 (在上述情况下,员工应翻译成员工姓名并根据其性别需要翻译他或她自己的单词)

  2. 是否有自动翻译带有上述信息的文本的机制。

+0

那么,翻译基于性别的单词应该是很容易的......但是你会有多少其他单词短语?[员工]?为什么是输入文字?谁在写这个?如果你在控制,你应该使用某种模板,而不是像“是优秀的,因为可以识别自己......” – mpen 2009-12-31 05:14:17

+0

输入文本是由作者负责创建各种这样的模板。不知道如何让作者知道,所有正在被支持或可以被动态翻译的变量参数列表。 – Joe 2009-12-31 07:00:57

回答

1

这是Natural Language Processing的一个非常广泛的问题。有很多方法可以解决它,你问的问题似乎太宽泛。

如果我明白你的问题的正确部分可以这样做是这样的:

@variable {name}是优秀的@gender {他/她}可识别@gender {他/她}自己优点和缺点,并且对@gender {他/她自己}感到满意。

或者:

@name是优秀的@he可以识别@his自己的长处和弱点,以及熟悉@himself。

...如果性别是主要问题。

+0

目前,变量参数列表仅限于名称,性别(他,她,她,她自己)... – Joe 2009-12-31 07:13:42

1

我有一些经验与工具的工作称为Grammatica,建立一个自定义用户输入练成像公式分析和评估引擎时。它可能不是你想要的复杂程度,但它是一个开始。这基本上使用了流行的代码编译器解析器使用的许多相同的概念。这绝对值得一试。

0

我同意Kornel,这个问题太广泛了。你似乎在谈论的是RDF和OWL可以成为一个很好的起点的语义。阅读关于建模语义学使用标记,你可以从那里工作。

+0

与RDF相比,我更喜欢简单的方法,我不太熟悉OWL。 – Joe 2009-12-31 07:03:10