我很努力与匹配一个3字的句子与一个二字的digram字典,它计数(第一个字和第二个字)和(第二个字和第三个字的频率)。我想要的是如何匹配的字符串(AAA BBB CCC)是在双精度和(AAA BBB)有一个计数和(BBB CCC)有一个计数,然后我们采取最大?Python,匹配bigram字典与文本
Counter({
('BBB', 'DDD'): 3,
('AAA', 'BBB'): 2,
('DDD', 'XXX'): 1,
('DDD', 'YYY'): 1,
('YYY', 'BBB'): 1,
('BBB', 'CCC'): 1,
('CCC', 'AAA'): 1,
('XXX', 'BBB'): 1})
plase解释你的字典中的键的样子,以及3个字序列的类型....他们是字符串还是元组或什么? – 2013-03-10 01:48:56
你能解释一下你想做什么吗?我不认为有一种通用的方法可以知道“AAA BBB CCC”是否出现在仅给出双字典的语料库中。 – Blckknght 2013-03-10 01:57:27
如果我有一个句子(AAA BBB CCC)和字典的双字节频率。我想比较一下,如果bigram(AAA,BBB)> bigram(BBB,CCC)那么这个句子就是括号,否则它就是正确的括号。 – Peace 2013-03-10 02:37:58