2016-10-04 94 views
2

我正在寻找一些关于自然语言处理的建议。 我想做一些研究,但我不知道我在研究什么。听起来很尴尬,但.. .. 想象一下,我有一个关于动物的文字。它包含句子,如自然语言处理 - 从文本中获取有关动物的数据

“狗生活在北极,它们约为1-3m长。”

而这样的东西。不仅是关于狗,还有一些用文字描述动物的文字。 现在我正在寻找分析文本并识别“keywords”(如"live""long")的东西,然后收集数据,并为您提供类似于购买新打印机时所获得的动物数据表的内容。

所以我不是在寻找一个工具或类似的东西(但不介意)我需要更多的关于关键字的一些建议,我可以做一些研究。从搜索nlp开始非常艰难。 在此先感谢!

+0

尝试不同的句子,你有兴趣,在斯坦福解析器。它会给你一个关于你想要的信息出现在哪种选区的想法。然后你需要做的就是找到动物,解析句子并看看那些选区。也许你甚至可以做到这一点,而不会陷入机器学习(ifying)你的任务的麻烦 - 假设你不是计算机科学家,这会比帮助更麻烦。尝试在线斯坦福分析器的东西:http://nlp.stanford.edu:8080/parser/index.jsp – user3639557

回答

1

一旦你知道了你正在谈论的动物(可以通过训练模型在给定的文本中找到动物来完成),所有你需要做的就是使用“共同参考”并找出被告知的事情关于动物。我不明白你想做什么研究,但这是我会做的。

我会用Opennlp来训练动物模型,然后用coreference找出动物的特征,然后把它放在桌子上。

一些支持:here & here

+0

感谢您的意见(并清理我的问题)!这是非常有用的,正是我期待的。 – epix

+0

我很高兴帮助你! – Nuwanda

+0

好吧,现在我发现,甚至在文件中识别动物的拉丁名字也不是那么简单。除非你有大量的样本数据来训练你的模型,否则使用名称寻找器模型看起来并不是正确的方式... – epix