0
我有一堆翻译的文章,我想用它作为IBM Watson语言翻译的培训数据。使用这些文章进行培训的正确方法是什么?我是否会将整篇文章及其翻译作为平行语料库中的条目来使用,还是必须将文章分成几个句子并将其翻译对作为条目?IBM Watson语言翻译 - 使用平行语料库训练的正确方法
我有一堆翻译的文章,我想用它作为IBM Watson语言翻译的培训数据。使用这些文章进行培训的正确方法是什么?我是否会将整篇文章及其翻译作为平行语料库中的条目来使用,还是必须将文章分成几个句子并将其翻译对作为条目?IBM Watson语言翻译 - 使用平行语料库训练的正确方法
你有两种选择。
或者将文本分成带有from和to的短语对,然后创建一个forced_glossary或一个parallel_corpus。
或将所有翻译文本作为单个文件发送以创建monolingual_corpus。
详细的文档可在https://www.ibm.com/watson/developercloud/doc/language-translator/customizing.html#training 和API文档可在https://www.ibm.com/watson/developercloud/language-translator/api/v2/?curl#create-model