2014-09-22 91 views
0

我对NLP世界是全新的,我需要你的帮助才能开始使用漂亮的Stanford pos tagger来标记阿拉伯语句子。使用stanford pos tagger的阿拉伯语标记

我已经安装了包含两个阿拉伯训练标签的完整版本。

请我的GUID申请使用Java和Eclipse在阿拉伯语这个恶搞,

  1. 我应该导入?
  2. 我应该添加到模型
  3. 功能和库来处理阿拉伯语
  4. 可以这样恶搞给即使是没有受过训练的一组正确的标签。

其实,我已导航斯坦福大学的官方网站,但它不是那么有用

预先感谢您

+0

它是如何为你?你是否设法从阿拉伯文获得POS? – 2016-11-14 13:45:36

回答

1

这里是从那里你可以下载斯坦福解析器的链接:nlp.stanford.edu/software/lex-parser.shtml

我希望你已经在使用Java环境。因此请进入放置解析器文件的目录。

java -mx200m edu.stanford.nlp.parser.lexparser.LexicalizedParser -retainTMPSubcategories -outputFormat "wordsAndTags,penn,typedDependencies" englishPCFG.ser.gz mumbai.txt 

mumbai.txt是输入文件。

但我发现berkeley解析更好。你可以从https://code.google.com/p/berkeleyparser/downloads/list下载

下载解析器jar文件和Gramar for Arabic文本。

然后执行简单的命令:

java -jar BerkeleyParser-1.7gr eng_sm6.gr 

现在,输入您要分析任何句子。

对于POS,你可以从http://nlp.stanford.edu/software/tagger.shtml下载

+0

我需要与pos tagger解析器一起工作 – 2014-09-24 07:47:41

+0

@SalySa:你应该探索链接,过程是一样的。解析器本身会给你POS。你必须付出一点努力! – user123 2014-09-24 08:11:05

+0

@SalySa:更新了答案。检查是否有帮助 – user123 2014-09-24 08:32:19