2013-07-18 50 views
1

当我想在我的程序中使用bloomfilter时,会出现一些错误的肯定率。我不知道如何为这些单词创建一个whiltelist,这将会是错误的判断?任何人都可以给我一些提示吗?如何在bloomfilter中创建白名单?

+2

你不是指黑名单吗?布隆过滤器会给出错误*正面信息*,即不应该通过该信息。 –

+0

你想要做什么?创建一个**黑色** - 清单,以消除**所有**误报? ...这将在很大程度上毫无意义,因为它会消除使用布隆过滤器的优势。你也可以使用散列图。 – Dukeling

回答

2

如果您可以限制可能对Bloom Filter进行查询的空间,则可以在条目被散列到Bloom Filter中之后创建这样的列表。这个想法是,如果您事先知道所有可能的查询,并且该集合的大小相当小,那么您可以进行所有这些查询,并与布卢姆过滤器一起保存所有误报“是”的答案,以便知道避免他们在你跑步期间。最近的一篇生物信息学文章确实如此:http://minia.genouest.org/files/minia.pdf

当然,这取决于利用散列对象的某些属性。在链接的情况下,它知道条目是重叠的DNA k-mers,因此它们的扩展名在每一端只能有4个可能的值中的一个。