7

什么是条件随机场条件随机字段如何在结构化或非结构化文本中将专有名称标识为人员,组织或地点?使用条件随机场进行命名实体识别

例如:本品由计算器公司订购

是什么条件随机场做鉴定计算器公司作为一个组织?

回答

16

CRF是一个有区别的批处理标记模型,与最大熵马尔可夫模型在同一个通用族中。

完整的解释是书的长度。

的简短说明如下:

  1. 人类注释文本200-500K的话,标志着实体。
  2. 人类选择一组他们希望指示实体的功能。像大写字母这样的东西,或者这个词是否在带有标签的训练集中看到。
  3. 训练过程计算所有特征的出现次数。
  4. CRF算法的肉搜索适合计数的所有可能模型的空间以找到相当好的模型。
  5. 在运行时,解码器(可能是维特比解码器)查看一个句子,并决定分配给每个单词的标签。

的这个困难的部分是特征选择和步骤4

0

那么明白,你必须学习的东西很多的搜索算法。
开始

了解马尔可夫和贝叶斯网络的基本。
在coursera提供在线课程,由达芙妮科勒
https://class.coursera.org/pgm/lecture/index

CRF是一种特殊类型的马尔科夫网络,我们有观察和隐藏的状态。
目标是找到最佳的状态分配给未观察到的变量,也称为MAP问题。
准备好大量的概率和优化。 :-)

相关问题