是否有任何现有的带标记实体的数据集来训练MITIE模型? 我检查了链接,https://github.com/mit-nlp/MITIE/blob/master/examples/python/train_ner.py只用两个样本训练模型。是否有任何现有的带标记实体的数据集要训练?数据集训练MITIE模型
1
A
回答
2
我一直在寻找这样的东西。只是为了“通用”(因此不是非常有用的)NLU后端。到目前为止,我发现的唯一一件事是一个训练有素的模型,包含9个新闻类别(不是非常通用的)。请参阅此处的博客文章:http://eric-yuan.me/ner_1/
如果您可以选择切换NER,那么spaCy默认情况下会提供训练有素的模型。它的可视化前端可以通过谷歌“displacy”找到
如果您发现任何其他问题,请告诉我!
编辑:花了一天看着这个,我想我已经找到了你在追求什么。如果你去https://github.com/mit-nlp/MITIE/releases那里,你会发现MITIE自己的NER模型在维基百科,Freebase等训练。实际的训练数据集也在那里。他们的github页面上的README提供了关于如何使用预先训练的模型的示例。您还可以调查examples文件夹中的ner.py文件,以了解如何在Python代码中使用预先训练好的模型。
相关问题
- 1. 加速使用MITIE和Rasa的模型训练
- 2. FANN训练数据集
- 3. NLP模型训练
- 4. TensorFlow:自定义图像数据集上的训练模型
- 5. 分割训练数据以训练n个模型的最佳数量
- 6. 重新训练tensorflow模型
- 7. 如何训练ML模型?
- 8. 训练分类模型Opennlp
- 9. Keras训练稀疏模型
- 10. 错误训练im2txt模型
- 11. LightGBM:继续训练模型
- 12. SegNet - 训练我自己的数据集
- 13. R glm()不包括训练数据集
- 14. PyBrain:MemoryError:加载训练数据集
- 15. 加载训练有素的Keras模型并继续训练
- 16. 1)从整个训练集中训练CNN和2)训练集中的训练集,然后是整个训练集之间的区别是什么?
- 17. 使用大型数据集在Spark上训练BloomFilter
- 18. 如何使用较小的数据集训练Google Inception-v3模型?
- 19. 如何训练像Mnist这样的Libsvm数据集格式的naiveBayes模型?
- 20. 的R - 计算测试MSE给出从训练集训练模型和测试集
- 21. 在Matlab中训练数据集,验证数据集,测试数据集
- 22. 使用静态训练数据初始化StreamingKmeans模型
- 23. 将训练数据添加到现有模型(bin文件)
- 24. 如何删除派对::: ctree模型的训练数据?
- 25. 当改变输入数据时,Tensorflow模型没有训练
- 26. 使用训练的高斯混合模型标记新数据
- 27. CNTK:访问训练过的模型数据
- 28. LSTM训练模式
- 29. 意大利语Syntaxnet预训练模型
- 30. CNTK python api - 继续训练模型
非常感谢。如果我找到其他有用的数据集,我会在这里发表评论。 –
我尝试通过聚集手套向量并使用名称标记每个群集来创建具有标记实体的自己的数据集。你认为这是一个正确的方法吗? –
听起来很像,但我还没有玩过这个东西,但还没有确定。而且现在看起来我现在不会再回到这里了,因为我已经被分配到另一个项目了。你暂时独立。对不起:( –