深入理解树状数组

深入,理解,树状,数组 · 浏览次数 : 60

小编点评

**树状数组简介** 树状数组是一种简洁的数据结构,它能够支持单点修改和区间查询。它具有以下优点: * **单点修改效率高:**通过更新指定索引处的元素,可以同时影响其所有管辖的元素。 * **区间查询效率高:**通过从树状数组中查找指定范围内的元素,可以效率地查询所有这些元素。 **树状数组的构造** 树状数组通常使用以下步骤进行构造: 1. 初始化所有元素为 0。 2. 遍历原始数组,将元素添加到树状数组中。 3. 对于每个元素,从其索引处开始,向其所有管辖的元素进行单点修改。 4. 计算每个元素的最终值。 **树状数组的更新** 如果要修改树状数组中某个元素的值,可以使用以下步骤进行更新: 1. 找到元素的索引。 2. 修改元素的值。 3. 更新所有管辖该元素的元素。 **树状数组的查询** 如果要查询树状数组中指定范围内的元素的值,可以使用以下步骤进行查询: 1. 从树状数组中查找指定范围内的元素。 2. 计算这些元素的和。 **树状数组的负数二进制表示** 负数的二进制表示方法具有以下两种方法: * **补码:**将负数转换为最接近其绝对值的正数。 * **原码:**将负数转换为原码。 **树状数组的应用** 树状数组在各种编程领域都有广泛的应用,包括: * **算法:**树状数组可以用于高效地实现各种算法,例如排序和搜索。 * **数据结构:**树状数组可以用于构建各种数据结构,例如哈希表和平衡树。 * **数据库:**树状数组可以用于构建高效的索引。 **代码示例** ```java public class BinaryIndexedTree { int[] a; int[] c; public BinaryIndexedTree(int[] a) { this.a = a; this.c = new int[a.length + 1]; for (int i = 0; i < a.length; i++) { add(i + 1, a[i]); } } // 将 index 索引处的值更新为 num void update(int index, int num) { a[index] = num; add(index, num - a[index]); } // 更新 c[index] 的值,变化差值为 val void add(int index, int val) { for (int i = index; i < c.length; i += lowbit(i)) { c[i] += val; } } int query(int left, int right) { return query(right) - query(left - 1); } // 查询前缀和的方法 int query(int x) { int res = 0; for (int i = x; i > 0; i -= lowbit(i)) { res += c[i]; } return res; } int lowbit(int x) { return x & -x; } } ```

正文

树状数组

树状数组(BIT, Binary Indexed Tree)是简洁优美的数据结构,它能在很少的代码量下支持单点修改区间查询,我们先以a[] {1, 2, 3, 4, 5, 6}数组为例建立树状数组看一下树状数组的样子:

树状数组.png

可以发现:不是所有节点都是连接在一起的,c[1], c[2], c[3], c[4] 和 c[5], c[6] 分别构成了两棵树;奇数索引位置的节点只管辖一个数组元素(我们例子中以 1 为起始索引)。那么这个树状数组是怎么计算和推导出来的呢?

管辖的区间

树状数组的每个元素会管辖多少个数组元素?也就是说每个元素的区间长度是多少?我们从上图中已经知道了奇数的树状数组元素只管辖一个元素,区间为 c[x] = [x, x],那么我们只需再研究下偶数元素管辖的区间长度即可。

  • c[y] 所管辖的区间长度为 2k,其中 k 为 y 的 2 进制表示中最低位 1 后面所有 0 的数量;c[y] 所管辖的区间为:[y - 2k+ 1, y]

我们以 c[4] 为例,它管辖多少个元素呢?4 的 2 进制表示为 0100,最低位 1 后面 0 的数量为 2,即 k = 2,那么 2k= 22= 4,所以它管辖的区间长度为 4,也就是 4 个数组元素,区间为 [4 - 4 + 1, 4] = [1, 4]。

父节点是谁?

现在我们知道每个元素所管辖的区间范围了,那么我们怎么才能知道它的父节点是谁呢?就比如说我们现在得到了 c[1] 元素,我们想知道它的父节点,要怎么计算呢?

  • c[x] 的父节点为 c[x + lowbit(x)]

怎么回事?其中的**lowbit(x)**是什么东西?其实它的值和 2k一致,其中 k 为 x 的 2 进制表示中最低位 1 后面所有 0 的数量,熟悉不熟悉?这个 lowbit(x) 和我们上文中计算该元素所管辖区间长度的值一致!这不就简单了!

  • lowbit(x) 的计算方法:lowbit(x) = x & -x

    我们以计算 c[2] 为例,lowbit(2) = 2 & -2,其中 2 的 2 进制表示为 0010,-2 的 2 进行表示为 1110,它的计算方法为将 2 的所有非符号位二进制全部取反后再加 1,即 1101 + 1 = 1110,执行 & 运算后结果为 0010,十进制表示为 2,与 21值一致。lowbit 的计算用代码表示为:

        int lowbit(int x) {
            return x & -x;
        }
    
    
    

我们以 c[1] 节点为例计算下它的父节点是谁,lowbit(1) = 1 & -1 = 0001 & 1111 = 0001 = 1,那么它的父节点为 c[1 + 1] = c[2],与图上表示的一致。


现在我们已经知道如何通过计算来创建树状数组了, 接下来我们要看下它的应用。

区间查询

区间查询我们先讨论计算前 N 项和的方法,比如我们现在要查询前 6 项和,我们来看下它查询的过程:

  • 从 c[6] 开始找子节点,有 c[6] 管辖的区间为 [5, 6],那么再往下找需要找 c[4],它的区间为 [1, 4],计算这两个节点的和即可。

那么从 c[6] 跳到 c[4] 是如何计算出来的呢?我们可以通过 c[6] 区间的下界减 1 来得到,转换成公式表示即为 x - lowbit(x) = 6 - 2 = 4,当它跳到 c[4] 时发现已经满足求和条件,不再向下跳而结束查找,而且我们可以通过计算 4 - lowbit(4) = 4 - 4 = 0 ,可以发现当 x - lowbit(x) = 0 时为结束查找的条件。我们用代码来表示为:

    int query(int x) {
        int res = 0;
        for (int i = x; i > 0; i -= lowbit(i)) {
            res += c[i];
        }
        
        return res;
    }


那么我们计算区间 [3, 6] 的和该如何计算呢?我们从图中可以发现,先计算出[1, 6] 和 [1, 2] 的和,再使用前者减去后者即为所得,用代码表示为:

    int query(int left, int right) {
        return query(right) - query(left - 1);
    }


单点修改

如果我们要修改 a[x] 的值,我们仅需要修改所有管辖了 a[x] 的 c[y] 即可,而 a[x] 可能会被多个 c[y] 管辖,这些所有的 c[y] 节点该如何确定呢?我们可以回头再去看看前面的树状数组配图,比如我们要修改 a[1] 的值,那么我们需要修改 c[1], c[2] 和 c[4] ,能不能发现它是在不断的跳父节点修改?所以,如果我们要修改数组中某个元素的值,树状数组的更新则是不断地更新父节点值。好,我们直接上代码吧:

    // 将 index 索引处的值更新为 num
    void update(int index, int num) {
        a[index] = num;
        add(index, num - a[index]);
    }

    // 更新 c[index] 的值,变化差值为 val
    void add(int index, int val) {
        for (int i = index; i <= c.length; i += lowbit(i)) {
            c[i] += val;
        }
    }


建树

好了,区间查询和单点修改我们都讲完了,但是从头到尾我们还没说过树状数组是怎么建立的呢。我们可以想一下,c 数组初始化时每个索引处的值都为 0,建树仅需要将 a 数组中所有值都在树状数组中执行单点修改即可:

    public BinaryIndexedTree(int[] a) {
        this.a = a;
        this.c = new int[a.length + 1];
        
        for (int i = 0; i < a.length; i++) {
            add(i + 1, a[i]);
        }
    }


到这里我们基本上已经将树状数组讲解完毕了,它的全量代码如下:

public class BinaryIndexedTree {

    int[] a;

    int[] c;

    public BinaryIndexedTree(int[] a) {
        this.a = a;
        this.c = new int[a.length + 1];

        for (int i = 0; i < a.length; i++) {
            add(i + 1, a[i]);
        }
    }

    // 将 index 索引处的值更新为 num
    void update(int index, int num) {
        a[index] = num;
        add(index, num - a[index]);
    }

    // 更新 c[index] 的值,变化差值为 val
    void add(int index, int val) {
        for (int i = index; i < c.length; i += lowbit(i)) {
            c[i] += val;
        }
    }

    int query(int left, int right) {
        return query(right) - query(left - 1);
    }

    // 查询前缀和的方法
    int query(int x) {
        int res = 0;
        for (int i = x; i > 0; i -= lowbit(i)) {
            res += c[i];
        }

        return res;
    }

    int lowbit(int x) {
        return x & -x;
    }
}



巨人的肩膀

作者:京东物流 王奕龙

来源:京东云开发者社区 自猿其说Tech 转载请注明来源

与深入理解树状数组相似的内容:

深入理解树状数组

树状数组(BIT, Binary Indexed Tree)是简洁优美的数据结构,它能在很少的代码量下支持单点修改和区间查询,我们先以a[] {1, 2, 3, 4, 5, 6}数组为例建立树状数组看一下树状数组的样子:

深入理解线段树

线段树(Segment Tree)是常用的维护区间信息的数据结构,它可以在 O(logn) 的时间复杂度下实现单点修改、区间修改、区间查询(区间求和、区间最大值或区间最小值)等操作,常用来解决 RMQ 问题。 RMQ(Range Minimum/Maximum Query) 问题是指:对于长度为 n

深入理解跳表及其在Redis中的应用

跳表可以达到和红黑树一样的时间复杂度 O(logN),且实现简单,Redis 中的有序集合对象的底层数据结构就使用了跳表。本篇文章从调表的基础概念、节点、初始化、添加方法、搜索方法以及删除方法出发,介绍了调表的完整代码以及调表在redis中的应用。

[转帖]深入理解mysql-第六章 mysql存储引擎InnoDB的索引-B+树索引

一、引入索引 在没有索引的情况下,不论是根据主键列或者其他列的值进行查找,由于我们并不能快速的定位到记录所在的页,所以只能从第一个页沿着双向链表一直往下找,因为要遍历所有的数据页,时间复杂度就是O(n),所以这种方式显然是超级耗时的。所以我们需要采取一定的数据结构来存储数据,方便我们进行数据的增删改

Windows 7操作系统全面解析与实用技巧

深入介绍Windows 7操作系统的基础知识、功能特性、分类和基本操作技巧,包括核心功能、特征、分类、安装方法、启动、文件管理、个性化设置等方面。旨在帮助用户深入理解Windows 7,并掌握提高工作效率和个性化设置的实用技巧。

深入理解Prometheus: Kubernetes环境中的监控实践

在这篇文章中,我们深入探讨了Prometheus在Kubernetes环境中的应用,涵盖了从基础概念到实战应用的全面介绍。内容包括Prometheus的架构、数据模型、PromQL查询语言,以及在Kubernetes中的集成方式、监控策略、告警配置和数据可视化技巧。此外,还包括针对不同监控场景的实战

深入理解Spring AOP中的@EnableAspectJAutoProxy

本文详细探讨了Spring框架中的面向切面编程(AOP),特别是通过@EnableAspectJAutoProxy注解来启用和配置AOP的详细过程。

深入理解Django:中间件与信号处理的艺术

title: 深入理解Django:中间件与信号处理的艺术 date: 2024/5/9 18:41:21 updated: 2024/5/9 18:41:21 categories: 后端开发 tags: Django 中间件 信号 异步 性能 缓存 多语言 引言 在当今的Web开发领域,Djan

深入理解 Swift Combine

Combine 文中写一些 Swift 方法签名时,会带上 label,如 subscribe(_ subscriber:),正常作为 Selector 的写法时会忽略掉 label,只写作 subscribe(_:) ,本文特意带上 label 以使含义更清晰。 Combine Framework

深入理解正则表达式:从入门到精通

title: 深入理解正则表达式:从入门到精通 date: 2024/4/30 18:37:21 updated: 2024/4/30 18:37:21 tags: 正则 Python 文本分析 日志挖掘 数据清洗 模式匹配 工具推荐 第一章:正则表达式入门 介绍正则表达式的基本概念和语法 正则表达