2016-08-02 68 views
0

我想要做的是添加一个自定义资源,告诉SyntaxNet将两个令牌合并为一个令牌。我正在处理来自NCBI的生物医学数据,物种几乎总是与他们的属(如属+物种)一起写入。我需要将属+物种格式保存为一个令牌。SyntaxNet是否允许我添加一个自定义的dicitonary?

EGS,

Arthrobacter globiformis (genus = "Arthrobacter", species = "globiformis") 
Desulfosporosinus meridiei (genus = "Desulfosporosinus", species = "meridiei") 
E. coli (genus = "E.", species = "coli") 

有没有办法在SyntaxNet不包括再培训做到这一点?

回答

0

恐怕没有简单的(和原则的)解决方案来解决您的问题。在使用SyntaxNet解析数据之前,您可以尝试预处理数据。更原则的解决方案将需要更改代码。

相关问题