2011-03-10 100 views
3

我目前正在使用语言建模工作在分类任务。该项目的第一部分涉及使用n-gram语言模型来使用c5.0对文档进行分类。项目的最后部分要求我使用交叉熵对每个类进行建模,并根据这些模型对测试用例进行分类。交叉熵语言建模

有没有人有使用交叉熵的经验,或者有关如何使用交叉熵模型进行采样数据的信息的链接?任何信息都会很棒!谢谢

回答

1

你可以得到在各种教科书上使用跨语言模型的理论背景,例如, “语言和语言处理”由Jurafsky & Martin,第116-118页在第2版中。 至于具体的用法,在大多数语言建模工具中,交叉熵不是直接测量的,而是交叉熵的“困惑”,即交叉熵。反过来,困惑可以用来分类文件。见例如在SLM命令“evallm”的文件,卡内基瓜大学语言建模工具(http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html)

好运:)