比较JDK 1.6中的HashMap和Hashtable源代码,我在HashMap中看到以下代码:
HashMap
Hashtable
/** * The default initial capacity - MUST be a power of two. */ static final int DEFAULT_INITIAL_CAPACITY = 16; int capacity = 1; while (capacity < initialCapacity) capacity <<= 1;
但是,在Hashtable中,我看到了以下内容:
table = new Entry[initialCapacity]; public Hashtable() { this(11, 0.75f); }
所以我的问题是:为什么HashMap需要2的幂作为初始容量,而Hashtable选择11作为默认初始容量?我认为这与Hashtable是线程安全的并且不允许空键或值无关。
以下文章更详细地解决了这个问题:HashMap需要更好的hashCode()-JDK 1.4 Part II。
根据那篇文章,转换为2的幂的主要原因是位掩码比整数除法快。这并非没有不利后果,其中一位原始作者对此进行了解释:
Joshua Bloch :使用2的幂的缺点是,生成的哈希表对哈希函数(hashCode)的质量非常敏感。至关重要的是,输入中的任何更改都必须影响哈希值的低位。(理想情况下,它应该以相同的可能性影响散列值的所有位。)因为我们不能保证这是真的,所以当我们切换到2的幂时,我们使用了一个次要(或“防御性”)散列函数。哈希表。在屏蔽低位之前,将此哈希函数应用于hashCode的结果。它的工作是将信息分散到所有位上,尤其是分散到低位位上。当然它必须 非常 运行 __速度很快,否则您将失去切换到2的幂的表格的好处。 1.4中原来的辅助哈希函数证明是不够的。我们知道这是理论上的可能性,但我们认为它不会影响任何实际数据集。我们错了。备用二级哈希函数(由我借助计算机开发)具有强大的统计特性,几乎可以保证良好的存储桶分配。