0. 前言

Q1. 要讲什么?

A1. 三棵树:线段树、平衡树、01Trie。无根号状物,请放心食用!!!

Q2. 为什么要讲这么简单的树?

A2. 首先,这三棵树在 noi 大纲中都是属于提高级的内容。

【 6 】线段树

【 6 】字典树(Trie树)

【 8 】平衡树:AVL、treap、splay等

级别更低的算法就意味着更容易被考到,考到所带来的模板差距(这里指一些人不会这个模板导致做不了题)也就越小。所以这些树是比较食用的。

1. 正文

1.1 线段树

线段树是普及组内容。

普通的线段树和主席树没有什么好讲的,我们讲一点高级技巧。

简单势能线段树

势能线段树就是在线段树上操作会消耗势能。(部分题目中势能也有可能会增加)

势能的总大小是可接受的,因此在线段树上暴力进行一些操作的时间复杂度是正确的。

常见的势能操作有:

例题1:洛谷 P4145 上帝造题的七分钟 2 / 花神游历各国

对于长度为 n,值域为 [1,V] 的序列进行 m 次如下两种操作:

  1. 对于区间 [l,r] 中的数开根号,即 aiai

  2. 查询区间 [l,r] 中的数的和。

n,m1051V1012

题解

发现一个数至多开根号 logV 次就会变成 1(事实上是 6 次),因此能开根号的情况下暴力开根号的操作次数是对的。

因此写一棵暴力线段树即可,时间复杂度 O(nlogn+mlognlogV)

例题2:洛谷 P9989 [Ynoi Easy Round 2023] TEST_69

对于长度为 n ,值域为 [1,V] 的序列进行 m 次以下操作:

  1. 对于区间 [l,r] 内的所有 iaigcd(ai,x)x 的值域为 [1,V]

  2. 查询区间 [l,r] 中的树的和,答案对 232 取模。

n2×105m5×1051V1018

题解

和上一题是类似的,取 gcd 也是至多 logV 次就会变成 1

一样可以使用线段树维护,check 一个区间的时候假设这个区间内的数的 lcm 满足 lcm|x,那么说明这个区间内的数与 xgcd 后值不会发生变化,因此无需递归下去。

不过一个区间内的数的 lcm 可能很大,和 V+1 取个 min 即可。

时间复杂度 O(mlognlogV)

1.2 01Trie

Trie 树也都会吧,01Trie 就是值域只有 0 和 1 的 Trie,在大部分情况下比普通的 Trie 有用,因为解决的不是字符串有关的问题,而是二进制位运算有关的问题。

如果想检测一下自己的到底会不会 01Trie,请到这题

可持久化 01Trie

这个感觉太简单了,有兴趣的自己可以看一看。

原理大概和主席树差不多。

这个是模板题

我自己都懒得写......

”满子树压缩“ 01Trie

“满子树压缩”这个名字是我自己起的。

原理大概就是将一个满子树的信息只用根节点就能表示出来,这样就可以用 O(logX) 个节点来表示 X 个连续的数的信息。

由于 Trie 树是二进制对齐的,因此可以用单个节点表示形如区间 [p2k,(p+1)2k1] 这样的区间中的所有信息。

例题:洛谷 P7156 [USACO20DEC] Cowmistry P

求从集合 S 中选取三个不同的数,使其两两分别异或的值 K 的方案数,答案对 109+7 取模。

集合 S 由值域上 n 个不交的区间 [Li,Ri] 并起来得到。

n2×1040K1090LiRi109

部分分:K,Ri106

题解

首先关于这种异或大小限制的题,第一个想法就是把这些数扔到 01Trie 上去。

从高往低找到第一个三个数不相同的位。一定是两个数该位为 0、一个数该位为 1 或者 两个数该位为 1、一个数该位为 0

那么那两个最高不同位相同的数异或起来一定不是三个数中两两异或的最大值。因此我们只需要考虑与另外两个数最高不同位不同的那个数并同时考虑与其异或起来最大的那个数即可。

我们只需要遍历整棵 01Trie,遍历的时候同时维护这两条路径,对于这两条路径已经确定的部分(两条路径是同时推进的,因此已经确定的高位的数量时相同),讨论它们的异或与 k 的对应的高位的大小关系。假设两条路径的已确定高位分别是 xyk 对应的高位为 k 表示按位异或):

  • xy<k,低位无论怎么取都有 xy<k,随便取都可以。

  • xy>k,低位无论怎么取都有 xy>k,怎么取都不合法。

  • 否则就只有 xy=k,这种情况直接向下递归即可。

由于一个 xk 可以确定唯一的一个 y,这意味着一条路径所对应的另一条路径是唯一的。因此上述算法的复杂度相当于整棵 01Trie 的大小。

但是 S 可以至多有 109 个元素,这意味着我们根本不能遍历整棵 01Trie。

考虑拆成将一个区间拆成若干个形如 [p2k,(p+1)2k1] 的区间,区间内不作拆分,并扔到 01Trie 上。

然后我们发现,当两个区间中有至少一个区间是满区间的时候,即使 xy=k 相同,也是可以算出来这两个区间的答案的。

假如两个区间中那个不满的区间里有 p 个元素,满的区间有 q=2k 个元素,k 所对应的未确定的低位为 k。我们知道若 ab=c,那么当确定了 a,b,c 中的任意两个时,另外的一个也可以被确定。

所以我们考虑 0zk 与不满区间的每一个元素 d,看对应的满区间中的元素是否存在。当 0a,b<2k 时,一定有 0ab<2k。又因为满区间的范围时 [0,2k1],因此一定存在对应的元素,所以符合条件的个数为 (k+1)p

所以我们在遇到满区间的时候便会终止递归,复杂度便相当于上述不进一步拆分区间的 01Trie 的大小,也就是 O(nlog2V),其中 V 是值域大小。

但是别忘了还有对应的第三个数,其实这个只需要在递归的路径上统计有多少个数异或另一条路径比当前路径异或另一条路径的值小即可。

注意会有两条路径完全一致的情况,这种情况需要特殊处理。

鉴于这题细节比较多,这里给出我的代码。

代码

1.3 平衡树

介绍

平衡树有很多种,什么 Splay 啊、Treap 啊、黑红树啊。

我认为只要学 FHQ Treap 就够了。无他,简单,好记。

核心操作

FHQ Treap 的本质是一棵二叉搜索树,只不过通过了随机化的性质保证了其树高为 logn 级别。

FHQ Treap 的核心操作有两个:分裂和合并。

按值分裂

分裂操作就是将一棵 FHQ Treap 按照权值是否 k 分裂成两棵 FHQ Treap。

定义函数 split(o,k,x,y) 表示将以 o 为根的 FHQ Treap 其中权值 k 的节点划分到以 x 为根的树上,其余划分到以 y 为根的树上,xy 由这个函数返回。

根据二叉搜索树的性质(一个点左子树所有节点的权值一定小于当前节点,右子树所有节点的权值一定大于当前节点),根据当前根节点的权值大小与 k 的大小关系进行分讨,假设根节点的权值为 q

不难看出上述流程的时间复杂度是 O(dep) 的,其中 dep 是整棵树深度。

按大小分裂

和按值分裂差不多,k 的含义从权值变成了节点个数,表示这个棵树内权值前 k 小的节点划分进 x 树,其余划分进 y 树。写法有点类似与线段树上二分。

合并

合并操作就是将两棵 FHQ Treap 合并成一棵 FHQ Treap,但是需要事先保证两棵树之间的权值大小关系,即需要保证左侧树的所有节点的权值均小于右侧树所有节点的权值。

定义函数 merge(x,y) 表示将以 x 为根的 FHQ Treap 和以 y 为根的 FHQ Treap 合并成一棵 FHQ Treap,x 为上文中的左侧树,y 为上文中的右侧树,函数返回这棵合并后的树的根节点。

此时就需要用到上文所说的随机化了,具体的随机化方法是在一开始给每一个点定一个随机权值(不同于上文中的权值,上文的权值是我们手动给定的,这个随机权值是随机得到的),若两个节点在树上为祖先关系,则一定随机权值大的那个是随机权值小的那个的祖先。

可以证明这样随机化树高是 O(logn) 级别的,证明我不会。

根据上文的随机化,进行两棵树根节点的随机权值大小的分讨,假设 x 的随机权值为 py 的随机权值为 q

不难看出上述流程的时间复杂度同样是 O(dep) 的。

拓展操作

有了上述两个核心操作之后,我们就可以对这棵 FHQ Treap 进行随意“把玩”了。

下列操作绝大部分都是有点“暴力”的,因此会有一点常数,实际上也可以通过非暴力的写法来降低常数,但是写起来会很麻烦。

插入节点

根据新节点的值分裂成两棵树,再按照 左-新-右 的顺序合并即可。

删除节点

根据要删除节点的值分裂成三棵树,分别是小于该节点,该节点,大于该节点的树,将该节点删除后合并左右两棵树即可。

查询前驱后继

按照查询的值分裂两棵树,根据查的是前驱还是后继来决定是找的是左树的最大值还是右树的最小值,具体可以通过不断在树上走左儿子或者走右儿子来实现。

值查询排名

维护每个子树的大小,将小于 x 的值分裂出来后统计分裂出来的大小,再将两棵树合并。

或者直接沿着路径 dfs 一遍,路径上动态统计有多少个节点的权值小于 x

排名查询值

根据大小 k11nk 分裂成三棵树,查询中间那棵树的节点的权值,然后合并回去。

或者可以手动模拟按大小分裂的流程,但是不实际分裂,找到排名对应的节点。

例题1:洛谷 P6136 【模板】普通平衡树(数据加强版)

动态维护可重集,初始有 n 个数,支持 m 次以下若干操作:

  1. 插入一个数 x

  2. 删除一个数 x,多个只删除一个。

  3. 查询 x 在可重集中的排名。

  4. 查询可重集中排名第 x 位的数。

  5. 查询 x 在可重集中的前驱。

  6. 查询 x 在可重集中的后继。

强制在线。n105m106,值域为 [0,2301]

题解

平衡树模板题,该讲的上面都已经讲了。可能唯一没讲到是删除怎么只删一个,只需要按值分裂得到中间树之后删除这棵树的根节点,将其两棵子树合并得到新的中间树即可。

这里给出参考代码。

代码

带 tag 的平衡树

平衡树上 tag 其实非常简单,跟线段树上 tag 差不多的思想,只需要在分裂和合并两个操作遍历到对应节点的时候下传 tag 即可,如果你自己写了额外遍历树的 dfs,记得在那里也加上下传 tag。

基本上,线段树上能放什么 tag,平衡树上就能放什么 tag。

例题2:洛谷 P3391 【模板】文艺平衡树

给你一个长度为 n 的有序数列,进行 m 次以下操作:

  • 翻转该有序序列上给定的一个区间 [Li,Ri]

输出 m 次变换完后的有序序列。

n,m1051LiRin

题解

平衡树 tag 非常经典的一个运用,本题中平衡树的 tag 为该区间是否要翻转。

因为一个区间翻转两次等于没翻转,所以 tag 的状态只有 0 和 1 两种。

怎么对某一个区间打翻转标记呢?将该区间分裂出来并在其根节点打上翻转 tag,最后合并回去即可。

由于是模板题,同样给出参考代码。

代码

可持久化平衡树

这个东西没什么用的,也不难,按照线段树照葫芦画瓢即可。

感兴趣的可以自行取洛谷上找模板题。

平衡树有交合并

之前提到平衡树的合并操作都是要求两棵树值域不交的。

那么当遇到两棵树值域有交的情况该如何合并呢?

有一个广为流传的合并方法是启发式合并,但这个很明显是错误的。例如我将一棵树分裂成两棵大小一半的树,在合并回去,这样单次启发式合并的复杂度就可以被卡满到 O(nlogn) 级别。

这里给出一个很简单并且复杂度正确的平衡树合并:将两棵树分别划分成尽量少的若干段,使得这若干段分别没有交,再按照大小顺序逐一进行无交合并即可。

复杂度我也不会证,大概可以用势能证出是两只 log 的。

例题3:洛谷 P10284 [USACO24OPEN] Splitting Haybales P

你有一个数 x,有 n 次操作,第 i 次操作为:

  • x0,则 xx+ai,否则 xxai

q 次询问,每次询问给定 x 的初始值,依次对 x 进行第 Li 次至第 Ri 次操作,求经过这些操作后 x 的值。

n,q2×1051ai105|x|1091LiRin

题解

考虑扫描线,扫到一个询问的左端点时将这个询问的 x 扔到平衡树中,扫到右端点时再查询这个询问对应的 x 现在的值是什么。

对于一次操作,考虑它对于平衡树来说是什么操作。首先将平衡树中的点分成按值分裂成 0>0 两棵树,然后对于同一棵树内的点同时加上一个数 k,最后再将两棵树合并到一起。

整体加 k 可以用平衡树上 tag 实现,由于整体加之后两棵树可能会有重叠,因此我们需要平衡树有交合并。

并没有什么很难的地方,因此这里只给出平衡树有交合并部分的实现。

代码

其中 tr[x].mi 为以 x 为根的子树中的最小值,merge 为核心操作中的平衡树无交合并。

平衡树合并练习:洛谷 P8264 [Ynoi Easy Round 2020] TEST_100

平衡树综合练习:洛谷 P3274 [SCOI2011] 植物大战僵尸