react diff 算法

06-01 1257阅读

diff 算法作为 Virtual DOM 的加速器,其算法的改进优化是 React 整个界面渲染的基础和性能的保障,同时也是 React 源码中最神秘的,最不可思议的部分

diff 算法会帮助我们就算出 VirtualDOM 中真正变化的部分,并只针对该部分进行原生 DOM 操作,而不是渲染整个页面。从而保证了每次操作更新后页面的高效渲染

一、传统算法

计算一棵树形结构转换为另一棵树形结构需要最少步骤,如果使用传统的 diff 算法通过循环递归遍历节点进行对比,其复杂度要达到 O(n^3),其中 n 是树中节点总数,效率十分低下,假设我们要展示 1000 个节点,那么我们就要依次执行上十亿次的比较

1. 核心代码

// 差异比较函数,比较两个树的叶子节点
const diffLeafs = (beforeLeaf, afterLeaf) => {
  // 用于存放差异比较结果的数组
  let res = [];
  // 获取较大节点树的长度
  const count = Math.max(beforeLeaf.children.length, afterLeaf.children.length);
  // 循环遍历节点
  for (let i = 0; i  

2. 使用

// 创建两棵树的结构
const beforeTree = {
  tagName: 'div',
  children: [
    {
      tagName: 'h1',
      innerHTML: 'Hello, World!',
    },
    {
      tagName: 'p',
      innerHTML: 'This is a sample text.',
    },
  ],
};
const afterTree = {
  tagName: 'div',
  children: [
    {
      tagName: 'h1',
      innerHTML: 'Hello, Universe!', // 改变内容
    },
    {
      tagName: 'p',
      innerHTML: 'This is a sample text.',
    },
    {
      tagName: 'a', // 添加节点
      innerHTML: 'Learn More',
    },
  ],
};
// 运行差异比较函数
const differences = diffLeafs(beforeTree, afterTree);
// 输出差异比较结果
console.log(differences);

二、算法实现

React 将 Virtual DOM 树转换为 Actual DOM 的最少操作过程称为调和(Reconciliation),diff 算法便是调和的具体实现。

React 通过制定大胆的策略,将 O(n^3) 复杂度的问题转换成 O(n) 复杂度的问题。

首先需要明确,只有 React 更新阶段才会有 diff 算法的运用

三、算法策略

  • Web UI 中 DOM 节点跨层级的移动操作特别少,可以忽略不计
  • 拥有相同类的两个组件将会生成相似的树形结构,拥有不同类的两个组件将会生成不同的树形结构。
  • 对于同一层级的一组子节点,它们可以通过 UUID(key)进行区分。

    基于以上三个前提策略,React 分别对 Tree Diff、Component Diff、Element Diff 进行算法优化,事实也证明这三个前提策略是合理且准确的,它保证了整体界面构建的性能

    四、算法粒度

    1. Tree Diff

    Tree Diff 即对树进行逐层对比的过程,两棵树只会对同层次的节点进行比较。

    既然 WebUI 中的 DOM 节点跨层级的移动操作少到可以忽略不计,针对这一现象,React 通过 updateDepth 对 Virtual DOM 树进行层级控制,只会对相同颜色方框内的 DOM 节点进行比较,即同一个父节点下的所有子节点。当发现节点已经不存在,则该节点及其子节点会被完全删除掉,不会用于进一步的比较。这样只需要对树进行一次遍历,便能完成整个 DOM 树的比较

    1.1. 原理

    如下图所示,A 节点(包括其子节点)被整个移动到 D 节点下面去,由于 React 只会简单的考虑同级节点的位置变换,而对于不同层级的节点,只有创建和删除操作,所以当根节点发现 A 节点消失了,就会删除 A 节点及其子节点,当 D 发现多了一个子节点 A,就会创建新的 A 作为其子节点。

    此时,diff 算法的执行情况是:create A => create B => create C => delete A

    react diff 算法

    由此可见,当出现节点跨层级的移动时,并不会出现想象中移动操作,而是会进行删除,重新创建的动作,这是一种很影响 React 性能的操作。因此 React 官方也不建议进行 DOM 节点跨层级的操作

    提示:在开发组件时,保持稳定的 DOM 结构会有助于性能的提升。例如,可以通过 CSS 隐藏或显示节点,而不是真的移除或添加 DOM 节点。

    2. Component Diff

    在进行 Tree Diff 过程中,每层组件级别的对比,叫做 Component Diff。

    • 如果对比前后,组件的类型相同,则按照原策略继续进行 Virtual DOM 比较
    • 如果对比前后,组件的类型不相同,则需要移除旧组件,创建新组件,并追加到页面上

      如果是同类型的组件,有可能经过一轮 Virtual DOM 比较下来,并没有发生变化。如果我们能够提前确切知道这一点,那么就可以省下大量的 diff 运算时间。因此,React 允许用户通过 shouldComponentUpdate 来判断该组件是否需要进行 diff 算法分析

      如下图所示, 当 component D 变为 component G 时,即使这两个 component 结构相似,一旦 React 判断 D 和 G 是不同类型的组件,就不会比较两者的结构,而是直接删除组件 component D,重新创建 component G 及其子节点。虽然当两个组件是不同类型但结构相似时,进行 diff 算法分析会影响性能,但是毕竟不同类型的组件存在相似 DOM 树的情况在实际开发过程中很少出现,因此这种极端因素很难在实际开发过程中造成重大影响

      react diff 算法

      3. Element Diff

      在进行组件对比的时候,如果两个组件类型相同,则需要进行元素级别的对比,这叫做 Element Diff。

      Element Diff 对应三种节点操作,分别为 INSERT_MARKUP(插入)、MOVE_EXISTING(移动) 和 REMOVE_NODE(删除)。

      • INSERT_MARKUP:新的组件类型不在旧集合中,即全新的节点,需要对新节点进行插入操作。
      • MOVE_EXISTING:旧集合中有新组件类型,且 element 是可更新的类型,generateComponent 已调用 recevieComponent,这种情况下 prevChild = nextChild,这时候就需要做移动操作,可以复用以前的 DOM 节点。
      • REMOVE_NODE:旧组件类型,在新集合里也有,但对应的 element 不同则不能直接复用和更新,需要执行删除操作,或者旧组件不在新集合里的,也需要执行删除操作。

        如下图,老集合中包含节点:A、B、C、D,更新后的新集合中包含节点:B、A、D、C,此时新老集合进行 diff 差异化对比,发现 B != A,则创建并插入 B 至新集合,删除老集合 A;以此类推,创建并插入 A、D 和 C,删除 B、C 和 D

        react diff 算法

        React 发现这类操作繁琐冗余,因为这些都是相同的节点,但由于位置发生变化,导致需要进行繁杂低效的删除、创建操作,其实只要对这些节点进行位置移动即可。

        针对这种情况,React 提出优化策略:允许开发者对同一层级的同组子节点,添加唯一 key 进行区分,虽然只是小小的改动,性能上却发生了翻天覆地的变化。

        新老集合所包含的节点,如下图所示,新老集合进行 diff 差异化对比,通过 key 发现新老集合中的节点都是相同的节点,因此无需进行节点删除和创建,只需要将老集合中节点的位置进行移动,更新为新集合中节点的位置,此时 React 给出的 diff 结果为:B、D 不做任何操作,A、C 进行移动操作,即可

        react diff 算法

        那么,如此高效的 diff 到底是如何运作的呢?让我们通过源码进行详细分析。

        先搞清楚 3 个 index 索引:

        nextId:遍历 nextChildren 时候的 index,每遍历一个元素加 1

        lastIndex:默认为 0,表示上次从 prevChildren 中取出元素时,这个元素在 prevChildren 中的 index

        _mountIndex:元素在数组中的位置

        4. element diff 逻辑概括

        首先对新集合的节点进行循环遍历,for (name in nextChildren),通过唯一 key 可以判断新老集合中是否存在相同的节点,if (prevChild === nextChild)。

        如果存在相同节点,则进行移动操作,但在移动前需要将当前节点在老集合中的位置与 lastIndex 进行比较,if (child._mountIndex

        这是一种顺序优化手段,lastIndex 一直在更新,表示访问过的节点在老集合中最右的位置(即最大的位置),如果新集合中当前访问的节点比 lastIndex 大,说明当前访问节点在老集合中就比上一个节点位置靠后,则该节点不会影响其他节点的位置,因此不用添加到差异队列中,即不执行移动操作,只有当访问的节点比 lastIndex 小时,才需要进行移动操作

        5. element diff 差异对比过程

        以上图为例,可以更为清晰直观的描述 diff 的差异对比过程:

        • 从新集合中取得 B,判断老集合中存在相同节点 B,通过对比节点位置判断是否进行移动操作
            • 判断过程:B 在老集合中的位置 B._mountIndex = 1,此时 lastIndex = 0(首次遍历时默认为 0),不满足child._mountIndex
            • 更新索引:更新 lastIndex = Math.max(prevChild._mountIndex, lastIndex),其中 prevChild._mountIndex 表示 B 在老集合中的位置,则 lastIndex = 1,并将 B 的位置更新为新集合中的位置 prevChild._mountIndex = nextIndex,此时新集合中 B._mountIndex = 0,nextIndex++ 进入下一个节点的判断。
              • 从新集合中取得 A,判断老集合中存在相同节点 A,通过对比节点位置判断是否进行移动操作
                  • 判断过程:A 在老集合中的位置 A._mountIndex = 0,此时 lastIndex = 1,满足 child._mountIndex
                  • 更新索引:更新 lastIndex = Math.max(prevChild._mountIndex, lastIndex),则 lastIndex = 1,并将 A 的位置更新为新集合中的位置 prevChild._mountIndex = nextIndex,此时新集合中 A._mountIndex = 1,nextIndex++ 进入下一个节点的判断。
                    • 从新集合中取得 D,判断老集合中存在相同节点 D,通过对比节点位置判断是否进行移动操作
                        • 判断过程:D 在老集合中的位置 D._mountIndex = 3,此时 lastIndex = 1,不满足 child._mountIndex
                        • 更新索引:更新 lastIndex = Math.max(prevChild._mountIndex, lastIndex),则 lastIndex = 3,并将 D 的位置更新为新集合中的位置 prevChild._mountIndex = nextIndex,此时新集合中 D._mountIndex = 2,nextIndex++ 进入下一个节点的判断。
                          • 从新集合中取得 C,判断老集合中存在相同节点 C,通过对比节点位置判断是否进行移动操作
                              • 判断过程:C 在老集合中的位置 C._mountIndex = 2,此时 lastIndex = 3,满足 child._mountIndex
                              • 更新索引:更新 lastIndex = Math.max(prevChild._mountIndex, lastIndex),则 lastIndex = 3,并将 C 的位置更新为新集合中的位置 prevChild._mountIndex = nextIndex,此时新集合中 C._mountIndex = 3,nextIndex++ 进入下一个节点的判断,由于 C 已经是最后一个节点,因此 diff 到此完成

                                6. 算法源码

                                _updateChildren: function(nextNestedChildrenElements, transaction, context) {
                                  // 存储之前渲染的子元素
                                  var prevChildren = this._renderedChildren;
                                  // 存储已经移除的子元素
                                  var removedNodes = {};
                                  // 存储将要挂载的子元素
                                  var mountImages = [];
                                  // 获取新的子元素数组,并执行子元素的更新
                                  var nextChildren = this._reconcilerUpdateChildren(
                                    prevChildren,
                                    nextNestedChildrenElements,
                                    mountImages,
                                    removedNodes,
                                    transaction,
                                    context
                                  );
                                  // 如果新旧子元素都不存在,直接返回
                                  if (!nextChildren && !prevChildren) {
                                    return;
                                  }
                                  var updates = null;
                                  var name;
                                  var nextIndex = 0;
                                  var lastIndex = 0;
                                  var nextMountIndex = 0;
                                  var lastPlacedNode = null;
                                  for (name in nextChildren) {
                                    if (!nextChildren.hasOwnProperty(name)) {
                                      continue;
                                    }
                                    var prevChild = prevChildren && prevChildren[name];
                                    var nextChild = nextChildren[name];
                                    if (prevChild === nextChild) {
                                      // 同一个引用,说明是使用的同一个component,需要进行移动操作
                                      // 移动已有的子节点
                                      // 注意:这里根据nextIndex, lastIndex决定是否移动
                                      updates = enqueue(
                                        updates,
                                        this.moveChild(prevChild, lastPlacedNode, nextIndex, lastIndex)
                                      );
                                      // 更新lastIndex
                                      lastIndex = Math.max(prevChild._mountIndex, lastIndex);
                                      // 更新component的.mountIndex属性
                                      prevChild._mountIndex = nextIndex;
                                    } else {
                                      if (prevChild) {
                                        // 更新lastIndex
                                        lastIndex = Math.max(prevChild._mountIndex, lastIndex);
                                      }
                                      // 添加新的子节点在指定的位置上
                                      updates = enqueue(
                                        updates,
                                        this._mountChildAtIndex(
                                          nextChild,
                                          mountImages[nextMountIndex],
                                          lastPlacedNode,
                                          nextIndex,
                                          transaction,
                                          context
                                        )
                                      );
                                      nextMountIndex++;
                                    }
                                    // 更新nextIndex
                                    nextIndex++;
                                    lastPlacedNode = ReactReconciler.getHostNode(nextChild);
                                  }
                                  // 移除掉不存在的旧子节点,和旧子节点和新子节点不同的旧子节点
                                  for (name in removedNodes) {
                                    if (removedNodes.hasOwnProperty(name)) {
                                      updates = enqueue(
                                        updates,
                                        this._unmountChild(prevChildren[name], removedNodes[name])
                                      );
                                    }
                                  }
                                }
                                

                                五、更新渲染

                                1. 合并操作

                                当调用 component 的 setState 方法的时候,React 将其标记为 dirty,到每一个事件循环结束,React 检查所有标记 dirty 的 component 重新绘制。

                                这里的合并操作是指,在一个事件循环当中,DOM 只会被更新一次,这个特性是构建高性能应用的关键,而且用通常的 JavaScript 代码难以实现,而在 React 应用里,你默认就能实现

                                2. 子树渲染

                                调用 setState 方法时,component 会重新构建包括子节点的 Virtual DOM。如果你在根节点调用 setState,整个 React 的应用都会被重新渲染。所有的 component 即便没有更新,都会调用他们的 render 方法。这个听起来可怕,性能貌似很低,但实际上我们不会触碰真实的 DOM,运行起来没那样的问题。

                                首先,我们讨论的是展示用户界面。因为屏幕空间有限,通常你需要一次渲染成百上千条指令,JavaScript 对于能处理的整个界面,在业务路基上已经足够快了。

                                令一点,在写 React 代码时,每当有数据更新,你不是都调用根节点的 setState。你会在需要接收对应更新的 component 上调用,或者在上面的几个 component。你很少要一直在根节点上,就是说界面更新只出现在用户产生交互的局部

                                3. 选择性子树渲染

                                最后,你还有可能去掉一些子树的重新渲染。如果你在 component 上实现以下方法的话:

                                boolean shouldComponentUpdate(object nextProps, object nextState)

                                根据 component 的前一个和下一个 props/state,你可以告诉 React 这个 component 没有更新,也不需要重新绘制,实现得好的话,可以带来巨大的性能提升。

                                要用这个方法,你要能够对 JavaScript Object 进行比对,这样有很多细节的因素,比

                                如对比应该是深度的还是浅层的。如果要深的,我们是用不可变数结构,还是进行深度拷贝。

                                而且你要注意,这个函数每次都会被调用,所以你要确保运行起来花的时间更少,比 React 的做法时间少,还有比计算 component 需要的时间少,即使重新绘制并不是必要的

                                六、总结

                                • React 通过制定大胆的 diff 策略,将 O(n^3) 复杂度的问题转换成 O(n) 复杂度的问题
                                • React 通过分层求异的策略,对 tree diff 进行算法优化
                                • React 通过相同类生成相似树形结构,不同类生成不同树形结构的策略,对 component diff 进行算法优化
                                • React 通过设置唯一 key 的策略,对 element diff 进行算法优化
                                • 建议,在开发过程中,保持稳定的 DOM 结构会有助于性能的提升
                                • 建议,在开发过程中,尽量减少类似将最后一个节点移动到列表首部的操作,当节点数量过大或更新操作过于频繁时,在一定程度上会影响 React 的渲染性能

                                  七、结论

                                  帮助 React 变快的技术并不新颖,长久以来,我们知道触碰 DOM 是费时的,你应该合并处理读和写的操作,事件代理会更快。

                                  人们还是会经常讨论他们,因为在实际当中用 JavaScript 进行实现还是挺难的,React 突出的一个原因是这些优化默认就启动了,这就让你避免掉不小心把 App 写得很慢。

                                  React 消耗性能的模型很简单,很好理解:每次调用 setState 会重新计算整个子树。如果你想要提高性能,尽量少调用 setState,还有用 shouldComponentUpdate 减少大的子树的重新计算。

                                  总结一下 Diff 算法的大致流程:

                                  1. 又一个全局变量 updateDepth 来标识递归的深度,进行 diff 算法之前 +1,diff 算法结束之后 -1。当其重新变为 0 的时候表示整个 diff 算法结束了,可以拿更新队列 diffQueue 来更新 DOM 了
                                  2. Diff 算法只对同个父元素的同级子元素进行对比。如果元素的 type 和 key(如果有的话)相同,视为同一个元素,进行更新;否则替换掉。
                                  3. Diff 使用了一个局部变量:lastIndex ——记录已经处理的就列表中最靠后的元素。当元素的 ._mountIndex 大于 lastIndex 的时候,不需要移动元素。因为移动元素不会对前面对元素产生任何影响,因此可以省略这个动作,由于很多时候大部分元素处于这种情况下,因此这个局部变量提升了性能(有时候很明显)。 需要注意的是如果把列表中最后一个元素移到最前面,那么 lastIndex 就会大于后面对比的所有元素,导致的后果就是列表中所有元素都将被移动

免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度,360,搜狗等多加搜索引擎自动关键词搜索配图,如有侵权的图片,请第一时间联系我们。

目录[+]

取消
微信二维码
微信二维码
支付宝二维码