我需要使用MOSES创建印地语到英语翻译系统。我有一个包含大约10000个印地语句子和相应英文翻译的平行语料库。我遵循Baseline system creation page中描述的方法。但是,只是在第一阶段,当我想tokenise我的印地文语料,并试图执行 ~/mosesdecoder/scripts/tokenizer/tokenizer.perl -l hi < ~/corpus/trai
我在Python中做了一个机器学习期望最大化算法,基本上是IBM Model1的机器翻译实现(如果您想查看代码,请参考 here is my GitHub),它的工作原理,但完全适用。我现在正在并行计算上课,我想知道是否可以使用Python Multiprocessing更快地达到收敛。任何人都可以给我任何指针或提示?我甚至不知道从哪里开始。 编辑:我读了一圈,发现 this paper使用EM与