2012-07-08 62 views
2

我通过一个关于文本简化的项目,有几个开放源代码提供诸如斯坦福分析器等文本解析器。想知道是否有任何解析器能够使用机器学习来解析文本!使用机器学习的文本简化

+1

你想要做什么样的简化?你使用了什么样的复杂度量度? – dmh 2012-07-09 16:37:04

+0

我正在尝试使用'ML'进行语法简化。复杂性的度量是分析复杂性。我得到了包含用户需求的文档,我需要将文本更改为句子,因此这些句子可以表示故事卡,因为它在“极限编程”Agel方法论 – 2012-07-10 01:56:59

+0

您能否给我们提供一个具体的输入示例和期望的输出? “分析复杂性”对我来说似乎也不是很明确。确定文本的难度是一项不平凡的任务;你有什么样的用户需求? – dmh 2012-07-10 19:25:40

回答

1

OpenNLP是一个很好的开源库。您可以使用许多特定的机器学习算法(如MaxEnt)来训练此库以生成特定于您的需求的模型。你也可以看到这个discussion

虽然OpenNLP具有Apache许可证,但还有另一种名为LingPipe的工具,它也提供了类似的功能但许可证不同。

Mahout也是一个很好的机器学习库,但是,您需要使用其他解析器或您自己的实现从文本中提取特征。 Mahout需要学习功能。

教程: 1. OpenNLP Tutorials 2. LingPipe Tutorials

+0

坦克vikas,你会分享任何文件或教程,显示这些开源如何plz! – 2012-07-08 08:45:25

+0

这些都是非常受欢迎的项目,所以找到教程不应该是一个大任务。我仍然添加了一些链接到我的答案。另外还增加了一个机器学习库。希望这可以帮助。 – vikas 2012-07-08 11:56:35

+0

OpenNLP从SourceForge移动到Apache。请参考一个更新的文档:http://opennlp.apache.org/documentation.html – wcolen 2012-07-10 12:01:41