我想创建一个小的类似英语的语言来指定任务。基本的想法是将一个陈述分解成这些动词应该适用的动词和名词短语。我与NLTK工作,但没有得到我所希望的,如结果:自定义标记与nltk
>>> nltk.pos_tag(nltk.word_tokenize("select the files and copy to harddrive'"))
[('select', 'NN'), ('the', 'DT'), ('files', 'NNS'), ('and', 'CC'), ('copy', 'VB'), ('to', 'TO'), ("harddrive'", 'NNP')]
>>> nltk.pos_tag(nltk.word_tokenize("move the files to harddrive'"))
[('move', 'NN'), ('the', 'DT'), ('files', 'NNS'), ('to', 'TO'), ("harddrive'", 'NNP')]
>>> nltk.pos_tag(nltk.word_tokenize("copy the files to harddrive'"))
[('copy', 'NN'), ('the', 'DT'), ('files', 'NNS'), ('to', 'TO'), ("harddrive'", 'NNP')]
在每种情况下,未能实现的第一个字(选择,移动和复制),旨在为动词。我知道我可以创建自定义标记符和语法来解决这个问题,但同时我很犹豫是否会在很多这些东西超出我的联盟时重新发明轮子。我特别希望能够处理非英语语言的解决方案。
因此,无论如何,我的问题是: 有没有更好的标记这种类型的语法? 有没有一种方法可以使现有标注器比名词形式更频繁地使用动词形式? 有没有办法培训一个标签? 完全有更好的方法吗?
是否有可能使用(在雅各布答案等)的模型和培训句子(如在此答案)? – Sadik 2015-10-17 13:11:02