java - 扩容: rehash

xhz · 发表于 2024-1-22 18:12:35

重复一下，segment 数组不能扩容，扩容是 segment 数组某个位置内部的数组 HashEntry<K,V>[] 进行扩容，扩容后，容量为原来的 2 倍。首先，我们要回顾一下触发扩容的地方，put 的时候，如果判断该值的插入会导致该 segment 的元素个数超过阈值，那么先进行扩容，再插值，读者这个时候可以回去 put 方法看一眼。该方法不需要考虑并发，因为到这里的时候，是持有该 segment 的独占锁的。// 方法参数上的 node 是这次扩容后，需要添加到新的数组中的数据。
private void rehash(HashEntry<K,V> node) {
HashEntry<K,V>[] oldTable = table;
int oldCapacity = oldTable.length;
// 2 倍
int newCapacity = oldCapacity << 1;
threshold = (int)(newCapacity * loadFactor);
// 创建新数组
HashEntry<K,V>[] newTable =
      (HashEntry<K,V>[]) new HashEntry[newCapacity];
// 新的掩码，如从 16 扩容到 32，那么 sizeMask 为 31，对应二进制 ‘000...00011111’
int sizeMask = newCapacity - 1;

// 遍历原数组，老套路，将原数组位置 i 处的链表拆分到新数组位置 i 和 i+oldCap 两个位置
for (int i = 0; i < oldCapacity ; i++) {
      // e 是链表的第一个元素
      HashEntry<K,V> e = oldTable;
      if (e != null) {
         HashEntry<K,V> next = e.next;
         // 计算应该放置在新数组中的位置，
         // 假设原数组长度为 16，e 在 oldTable[3] 处，那么 idx 只可能是 3 或者是 3 + 16 = 19
         int idx = e.hash & sizeMask;
         if (next == null) // 该位置处只有一个元素，那比较好办
            newTable[idx] = e;
         else { // Reuse consecutive sequence at same slot
            // e 是链表表头
            HashEntry<K,V> lastRun = e;
            // idx 是当前链表的头节点 e 的新位置
            int lastIdx = idx;

            // 下面这个 for 循环会找到一个 lastRun 节点，这个节点之后的所有元素是将要放到一起的
            for (HashEntry<K,V> last = next;
                  last != null;
                  last = last.next) {
                  int k = last.hash & sizeMask;
                  if (k != lastIdx) {
                     lastIdx = k;
                     lastRun = last;
                  }
            }
            // 将 lastRun 及其之后的所有节点组成的这个链表放到 lastIdx 这个位置
            newTable[lastIdx] = lastRun;
            // 下面的操作是处理 lastRun 之前的节点，
            // 这些节点可能分配在另一个链表中，也可能分配到上面的那个链表中
            for (HashEntry<K,V> p = e; p != lastRun; p = p.next) {
                  V v = p.value;
                  int h = p.hash;
                  int k = h & sizeMask;
                  HashEntry<K,V> n = newTable[k];
                  newTable[k] = new HashEntry<K,V>(h, p.key, v, n);
            }
         }
      }
}
// 将新来的 node 放到新数组中刚刚的两个链表之一的头部
int nodeIndex = node.hash & sizeMask; // add the new node
node.setNext(newTable[nodeIndex]);
newTable[nodeIndex] = node;
table = newTable;
}
这里的扩容比之前的 HashMap 要复杂一些，代码难懂一点。上面有两个挨着的 for 循环，第一个 for 有什么用呢?仔细一看发现，如果没有第一个 for 循环，也是可以工作的，但是，这个 for 循环下来，如果 lastRun 的后面还有比较多的节点，那么这次就是值得的。因为我们只需要克隆 lastRun 前面的节点，后面的一串节点跟着 lastRun 走就是了，不需要做任何操作。我觉得 Doug Lea 的这个想法也是挺有意思的，不过比较坏的情况就是每次 lastRun 都是链表的最后一个元素或者很靠后的元素，那么这次遍历就有点浪费了。不过 Doug Lea 也说了，根据统计，如果使用默认的阈值，大约只有 1/6 的节点需要克隆。

原文链接：https://pdai.tech/md/java/thread/java-thread-x-juc-collection-ConcurrentHashMap.html

		自动登录	找回密码
密码			注册

java - 扩容: rehash

浏览过的版块