【数据结构】树状数组

树状数组学习笔记

早期人类编程

665人浏览 · 2025-04-24 08:36:08

早期人类编程 · 2025-04-24 08:36:08 发布

你干嘛,并查集之后,就到了树形数据结构了,O(∩_∩)O哈哈~

河马~~~

进入正题

树状数组

树状数组的特点是代码量小,常数小.但具有局限性,如处理区间最大值.

需要知道的是:
普通树状数组维护的信息及运算要满足 结合律 且 可差分，如加法（和）、乘法（积）、异或等。

结合律： $\circ y) \circ z = x \circ (y \circ z)$ ，其中 $\circ$ 是一个二元运算符。
可差分：具有逆运算的运算，即已知 $\circ y$ 和 $x$ 可以求出 $y$ 。

在树状数组中,以 $c$ 数组表示树状数组,且每个节点管辖特定的区间,那么在树状数组中, $c_x$ 管理的区间为 $[x - l o w bi t (x) + 1, x]$ , 长度为 $l o w bi t (x)$ .

//lowbit 运算
int lowbit(int x) {
    return x & (-x); // 利用补码性质
}

既然,每个节点有了特定的管辖区域,那么我们就可以解决区间查询的问题了.

区间查询

众所周知,我们可以用 $[1, r] - [1, l - 1]$ 得到 $[l, r]$ .
于是区间问题就变成了前缀和问题了.

那前缀和问题与该如何求解呢?
设想我们现在要求 $[1, x]$ ,我们是否可以将这一段区间分成几个小区间来求解？是的，我们可以.回顾 $c_x$ 表示的区间 $[x - l o w bi t (x) + 1, x]$ ,既然这段区间可以表示出来,那我们就要求右端点为 $x - l o w bi t (x)$ 的区间,又因为 $c_{x-lowbit(x)}$ 可以表示区间 $[x - l o w bi t (x) - l o w bi t (x - l o w bi t (x)), x - l o w bi t (x)]$ …以此类推即可覆盖区间 $[1, x]$

具体的,我们有:

从 $c [x]$ 开始往前跳，有 $c [x]$ 管辖 $a[x-\operatorname{lowbit}(x)+1 \ldots x]$ ；
令 $\gets x - \operatorname{lowbit}(x)$ ，如果 $x = 0$ 说明已经跳到尽头了，终止循环；否则回到第一步。
将跳到的 $c$ 合并(记录答案)。

      int query ( int x ){
        int ans = 0 ;
        for ( ; x ; x -= lowbit ( x ) ){
            ans += c[x] ;
        }
      }

单点修改

等等,你应该还没了解树状数组的树形结构吧(~~树状也,怎可不见矣?~~)

那么我们先了解一下树状数组的一些性质吧.
我们记 $l_x$ 表示 $c_x$ 的区间左端点.再者我们知道一个数 $x$ 可以表示为 $s*2^{k+1}+2^k$ , 则 $lowbit(x) = 2^k$

性质 $1$ :当 $\le y$ , 有 $c_x$ 与 $c_y$ 不交或包含

证明:设 $y=s*2^{k+1}+2^k,x=s*2^{k+1}+b(b\le 2^k)$ ,那么假设 $c_x$ 与 $c_y$ 相交.那么有 $l_y\le x$ .又因为 $l_x=s*2^{k+1}+b-lowbit(b)+1\ge l_y$ , 故 $l_y\le l_x \le x \le y$ ,证毕.

性质 $2$ : $c_x$ 真包含于 $c_{x+lowbit(x)}$

证明:设 $x=s*2^{k+1}+2^k,l_x=s*2^{k+1}+1$ ,记 $y = x + l o w bi t (x)$ ,有 $l_y=(s+1)*2^{k+1}-lowbit((s+1)*2^{k+1})+1\le l_x$ .证毕.

性质 $3$ : 对于 $x < y < x + l o w bi t (x)$ 有 $c_x$ 与 $c_y$ 不交.

证明:若 $c_x$ 与 $c_y$ 交, 设 $x=s*2^{k+1}+2^k,y=x+b(b<2^k)$ ,则 $l_y\le x$ ,而 $l_y=x+b-lowbit(b)+1>x$ ,矛盾.证毕.

有了上边的性质,就可以观察树状数组了.(到时可能会放图)

对于单点修改 $a_x$ ,发现只有管辖区间有 $x$ 的 $c$ 数组才会被更新(显然),结合性质 $1$ ,我们发现若 $c_y$ 包含 $x$ ,则一定包含 $c_x$ , 又在形态上 $c_y$ 是 $c_x$ 的祖先,因此我们可以从 $x$ 开始不断跳父亲，直到跳得超过了原数组长度为止。Code:

    void updata ( int x , int val ){
        for ( ; x <= n; x += lowbit(x) ){
            c[x] += val ; 
        }
    }

树状数组 1：单点修改，区间查询

代码

树状数组 2：区间修改，单点查询

提示：差分数组的前缀和 Code

区间加及区间和

该问题可以使用两个树状数组维护差分数组解决。

具体的,设 $d_i=a_i-a_{i-1}$ , 那么 $\sum_{i=1}^r a_i = \sum_{i=1}^r\sum_{j=1}^{i}d_i$
可以看出 $d_k$ 会出现 $(r - k + 1)$ 次,于是乎式子变成了这样:
$\sum_{i=1}^rd_i*(r+1)-\sum_{i=1}^rd_i*i$ .
这样我们只需用两个树状数组分别维护 $d_i$ 以及 $d_i*i$ 即可.
对于区间加来说, $d_l$ 增加 $v a l$ , $d_{r+1}$ 减少 $v a l$ , 而对于第二个树状数组来说,在第 $l$ 节点上增加 $v a l * l$ ,在第 $r + 1$ 节点上减少 $v a l * (r + 1)$ .

LOJ#132. 树状数组 3 ：区间修改，区间查询

代码

二维树状数组

本蒟蒻还未掌握,到时再Update.

权值树状数组

首先先明白一个序列 $a$ 的权值数组是什么

权值数组‌是一个一维数组，其中数组的下标对应原始序列中元素的值，数组元素的值表示原始序列中该下标值出现的次数。

离散化处理‌：当元素值范围较大时，可先离散化原始序列，再构建权值数组以压缩空间.

栗子就不举了.(逃)
而事实上,权值树状数组就是在权值数组上构建树状数组.他可以解决一些经典问题.

单点修改，查询全局第 $k$ 小

可以考虑在权值树状数组上进行二分,每次都要 $O (l o g N)$ 查询区间和,所以时间复杂度为 $O(log^2 N)$ .
~~时间都去哪了?~~
由于区间和耗费太多时间,于是聪明的你想的了倍增.具体的:
设 $x = 0$ ， $\mathrm{sum} = 0$ ，枚举 $i$ 从 $log_2n$ 降为 $0$ ：

查询权值数组中 $\ldots x + 2^i]$ 的区间和 $t$ 。
如果 $\mathrm{sum} + t < k$ ，扩展成功， $\gets x + 2^i$ ， $\mathrm{sum} \gets \mathrm{sum} + t$ ；否则扩展失败，不操作。

这样得到的 $x$ 是满足 $\ldots x]$ 前缀和 $< k$ 的最大值，所以最终 $x + 1$ 就是答案。

看起来这种方法时间效率没有任何改善，但事实上，查询 $\ldots x + 2^i]$ 的区间和只需访问 $c[x + 2^i]$ 的值即可。

原因很简单，考虑 $\operatorname{lowbit}(x + 2^i)$ ，它一定是 $2^i$ ，因为 $x$ 之前只累加过 $2^j$ 满足 $j > i$ 。因此 $c[x + 2^i]$ 表示的区间就是 $\ldots x + 2^i]$ 。

如此一来，时间复杂度降低为 $\Theta(\log n)$ 。

P1138 第 k 小整数

这道题说实话用树状数组太不实际了,但~~很有生活~~可以练练手.


struct TreeArray{
    int c[N] ;
    void updata ( int x , int val ){
        for ( ; x <= 30000 ; x += lowbit( x ) ){
            c[x] += val ;
        }
    }
    int query ( int x ){
        int ans = 0 ;
        for ( ; x ; x -= lowbit(x ) ){
            ans += c[x] ;
        }
        return ans ;
    }
    int ksmall ( int x ){
        int sum = 0 , k = 0 ;
        for ( int i = log2(30000) ; i >= 0 ; --i ){
            k += (1ll << i) ;
            if ( k > 30000 || sum + c[k] >= x ){
                k -= (1ll << i ) ;
            }else sum += c[k] ;
        }
        return k + 1 ;
    }
}t;