的补我有一本字典字母获取字典
letterstoProbabilityMap={"aaa":0.4,"bbb":0.7,"ccc":01}
对此我有三个字母串和他们发生(我缩短了字典)的概率。 我正在根据一些训练数据分配这些概率。但我也想分配一个概率给我没有看到的字符串/键。例如“aaa”。 因为我所有的密钥都在set aaa-zzz中。 有没有一种快速的方法让我获得非赋值/补码并快速赋值。 (我明白我的问题是相当抽象的。)
编辑 值不固定它实际上是一个地方概率。 下面是我用来计算我知道的概率的代码片段 重点是我保留一个概率质量,然后我将它分配给我没见过的三个字母字符串(因为我知道所有字符串都在aaa-zzz之间)
for trigram in sorted(threeletter_counts.keys()):
numerator=threeletter_counts[trigram]+1
denominator=twoletter_counts[trigram[:2]]+30
prob=numerator/denominator
因此,有你有26 * 26门* 26门的钥匙? aaa到zzz? – Pynchia
BTW 0.4 + 0.7 + ...大于1.0 – Pynchia
不完全我有一个相对随机数量的键之间aaa-zzz我想通过字典获得找出那些我没有哪些是在集aaa-zzz并分配一个值。我基本上为我的训练数据中没有的值进行拉平平滑处理 – NeptuneGamer