我正在努力研究什么是适应开放命名实体识别问题(生物/化学,所以没有实体字典存在但它们必须由上下文识别)的最佳模型。用于命名实体识别的TensorFlow RNNs
目前我最好的猜测是修改Syntaxnet,以便代替将单词标记为N,V,ADJ等,它学习标记为BEGINNING,INSIDE,OUT(IOB符号)。
但是我不确定哪种方法最好?
- Syntaxnet
- word2vec
- seq2seq(我认为这是不正确的,因为我需要它来学习两个比对的序列,而seq2seq是专为不同长度的序列中译本)
将不胜感激一个指向正确的方法!谢谢!
Syntaxnet和seq2seq会工作。 contrib中还有一个线性链式CRF。 – drpng