2016-05-17 79 views
1

在拼写错误检测任务中,我使用marisa_tries数据结构用于Python 3.5的词典。将元素添加到Marisa Trie中

短缺问题
如何在marisa_trie添加一个元素?

语境
的想法是:如果一个词在我的词典中,那么它是正确的。现在,如果它不在我的词典中,可能是不正确的。但是,我计算了整个文档中的单词频率,如果单词频率足够高,我想保存这个单词,因为它足够频繁,所以可能是正确的。 在这种情况下,如何将这个新词添加到我的marisa_trie.Trie词库中? (不必每次都建立新的树)?

谢谢:)

回答

2

marisa_trie.Trie实现了一个不变的线索,所以回答你的问题是:这是不可能的。

您可能想要尝试一种名为datrie的类似Python程序包,它支持修改和相对较快的查询(PyPI页面列出了针对内建的dict的一些基准)。

+0

谢谢你的回答。我会看看'datrie' :) – Arnaud