所以我已经读了Hash functions上的维基百科页面,因为我目前正在玩一些。 在这个页面和我读过的其他来源都提到数据的分布会影响散列函数。了解数据分布对散列的影响
尽管有一些解释,我仍然不清楚这些影响究竟是什么,也许是为什么。所以我的问题:
- 只是为了确保我已经得到了它的权利,当他们提到 分布,这是每个单词的输入数据 集的频率是多少?
- 输入数据的分布对散列 函数有什么影响?特别感兴趣的是,散列算法产生的输出的速度和均匀性方面的散列性能。
编辑1: 我从一个更有活力的来源特别是维基百科英语语料库VS数据的思维,Twitter的鸣叫例子。
谢谢,这确实有帮助。当你提到数据的类型时,我更新了这个问题。 – zcourts 2013-02-14 19:20:12