2013-04-20 95 views
0

我发现了一个关于多项朴素贝叶斯分类计算B和| V |在朴素贝叶斯文本分类

multinomial naive bayes link

联系我们如何计算B'|V|

页说,这是在词汇方面的数量。在它的例子中,我们如何能得到6B?这是所有术语的计数吗?

“中国”, “北京”, “上海”, “meacao”, “东京”, “日本”

还有一个问题,如果新名词出现的测试文件在哪?例如,在文档6中出现“曼谷”或任何从未出现过的新词。如何计算新术语的概率?

回答

1

你是对的。这是词汇表中单词的总数,因为在词汇表中只能有一个词条目。

+0

谢谢你,我只是想确认一下。 :) – mhabibi 2013-04-20 08:32:21

+0

还有一个问题,如果新术语出现在测试文档中会怎样? 例如,在doc 6中出现“曼谷”或任何从未出现过的新单词。如何计算新术语的概率? 谢谢激情:) – mhabibi 2013-04-20 09:38:23