1 条题解

  • 0
    @ 2026-5-5 17:55:26

    G. Your Loss 详细题解

    题目重述

    给定一棵 nn 个节点的树,节点 ii 有权值 aia_i。有 qq 个查询,每个查询给出两个节点 xxyy。设从 xxyy 的路径上的节点按顺序为 p0=x,p1,,pr=yp_0 = x, p_1, \dots, p_r = y,要求计算

    i=0r(apii)\sum_{i=0}^{r} \big( a_{p_i} \oplus i \big)

    其中 \oplus 表示按位异或。输出每个查询的结果。

    数据范围

    • tt 个测试用例,1t1041 \le t \le 10^4
    • 单个测试用例中 1n51051 \le n \le 5\cdot 10^5,所有测试用例的 nn 之和 5105\le 5\cdot 10^5
    • 1ai51051 \le a_i \le 5\cdot 10^5,因此 ai<220a_i < 2^{20}
    • 1q1051 \le q \le 10^5,所有测试用例的 qq 之和 105\le 10^5
    • 时间和内存限制:3 秒,256 MB。

    核心思路

    直接按路径遍历每个节点会超时(O(qn)O(q \cdot n))。需要将路径拆分为若干连续段,并快速计算每段内形如 (a(offset+i))\sum (a \oplus (\text{offset} + i)) 的和。由于树结构,可以采用树链剖分将任意路径分解为 O(logn)O(\log n) 条重链上的连续区间。对于每个区间,我们需要高效计算该区间内所有节点值与一个等差数列 (base+i)(\text{base} + i) 进行异或的和。

    二进制拆位

    因为异或运算按位独立,我们可以逐位计算贡献:

    $$\sum_{j=1}^{L} (x_j \oplus y_j) = \sum_{b=0}^{B-1} 2^b \cdot \big( \#\{j \mid (x_j)_b \neq (y_j)_b\} \big) $$

    其中 $B = \lceil \log_2(\max a_i + \text{路径长度})\rceil \le 20$(因为 ai5105<220a_i \le 5\cdot 10^5 < 2^{20}in5105<219i \le n \le 5\cdot 10^5 < 2^{19},所以 2020 位足够)。

    对于一段长度为 LL 的区间,节点值序列为 val0,val1,,valL1val_0, val_1, \dots, val_{L-1},对应下标 ii00L1L-1(全局路径中的实际下标为 base+i\text{base}+i)。对于第 bb 位,设:

    • cnt1cnt_1 为区间内节点值的第 bb 位为 11 的个数;
    • onesones 为区间内 base+i\text{base}+i 的第 bb 位为 11 的个数(即整数 base,base+1,,base+L1\text{base}, \text{base}+1, \dots, \text{base}+L-1 中第 bb 位为 11 的个数)。

    则第 bb 位不同的个数为:

    $$cnt_1 \cdot (L - ones) + (L - cnt_1) \cdot ones = cnt_1 \cdot L + (L - 2cnt_1) \cdot ones $$

    因此该位对总和的贡献为 2b2^b 乘以该值。

    快速计算 cnt1cnt_1onesones

    • cnt1cnt_1:对于树链剖分后的每条重链,我们可以预处理该链上所有节点值的二进制前缀和。即对于链上的节点序列 seq[0..len1]seq[0..len-1],预计算 pre[bit][i] 表示前 ii 个节点中第 bitbit 位为 11 的个数。这样任意区间 [l,r][l, r] 内的 cnt1cnt_1 可在 O(1)O(1) 内得到:pre[bit][r+1] - pre[bit][l]
    • onesones:需要计算等差数列 base,base+1,,base+L1base, base+1, \dots, base+L-1 中第 bb 位为 11 的个数。这是一个数学问题,可以用公式快速求出。设 T=2b+1T = 2^{b+1},则一个非负整数 xx 的第 bb 位为 11 当且仅当 xmodT[2b,2b+11]x \bmod T \in [2^b, 2^{b+1}-1]。因此区间 [L,R][L, R] 内第 bb 位为 11 的个数为:f(R)f(L1)f(R) - f(L-1) 其中 $f(x) = \left\lfloor\frac{x+1}{T}\right\rfloor \cdot \frac{T}{2} + \max(0, (x+1)\bmod T - \frac{T}{2})$。 该计算为 O(1)O(1)

    处理路径方向

    树链剖分将路径分解为若干段:

    • xx 向上到 LCA(不含 LCA)的若干重链段,这些段在重链上的顺序是从深到浅,但节点值的顺序与重链存储方向相反。由于我们只关心 cnt1cnt_1(与顺序无关),可以直接使用正向区间统计节点值。但注意,此时区间对应全局下标 ii 是递增的,而我们统计 cnt1cnt_1 时不受顺序影响,所以 cnt1cnt_1 直接取正向区间内节点即可。
    • 从 LCA 向下到 yy 的若干重链段,这些段在重链上是从浅到深,与存储方向一致,直接取正向区间。

    我们需要记录整个路径上每个节点对应的全局下标 ii(从 00 开始)。对于向上段,由于路径是逆向的,但计算贡献时 ii 仍然是顺序递增的,因此我们可以先计算当前段长度 lenlen,那么该段的起始下标为当前全局下标 curcur,节点顺序是逆向的。因为异或运算对顺序不敏感(只是每个节点与不同 ii 异或),我们的统计方式已经通过 cnt1cnt_1onesones 分离了节点值和下标的影响,所以可以直接用正向区间节点值(cnt1cnt_1)和连续下标区间 [cur,cur+len1][cur, cur+len-1] 计算,而不需要真正反转节点序列。

    算法流程

    1. 预处理
      • 对树进行轻重链剖分,得到每个节点的父节点、深度、子树大小、重儿子、链顶、在重链中的位置。
      • 记录每条重链的节点列表(从链顶到链底)。
      • 对于每条重链,对所有 b=019b = 0 \dots 19,计算前缀和 pre[bit][i]ii00lenlen)。
    2. 处理查询
      • 输入 x,yx, y
      • 求出 l=LCA(x,y)l = \text{LCA}(x, y)
      • 初始化当前全局下标 cur = 0,答案 ans = 0
      • 处理向上段xxll,包括 ll):
        • 将路径从 xx 向上跳重链,直到到达 ll 所在链。
        • 对每一段(链顶到当前节点),设该段在链上的区间为 [lpos,rpos][lpos, rpos]lposlpos 为链顶位置,rposrpos 为当前节点位置),长度为 len=rposlpos+1len = rpos - lpos + 1
        • 调用函数 calc(chain_id, lpos, rpos, cur),该函数:
          • 对于每个 bb,计算 cnt1cnt_1(利用前缀和),onesones(利用数学公式),得到该位贡献。
          • 将贡献累加到 ans
        • 更新 cur += len,然后 x=par[top[x]]x = par[top[x]] 继续循环。
      • 处理向下段llyy,不包括 ll):
        • yy 向上收集所有需要经过的重链段,但顺序是反向的(因为从 ll 向下到 yy 才是正向顺序)。
        • 先将所有段(从 yyll 的路径)收集到一个数组 segs 中,每段存储 (chain_id, lpos, rpos),其中 lposlpos 是段内较浅的一端(靠近 ll),rposrpos 是较深的一端(靠近 yy)。收集时注意 ll 本身不包含在内,所以最后一段从 pos[l]+1pos[l]+1 开始。
        • segs 反转,使得顺序变为从 ll 向下到 yy
        • 遍历 segs,对每个段调用 calc,每次更新 cur
      • 输出 ans

    复杂度

    • 预处理:O(nB)O(n \cdot B),其中 B=20B=20
    • 每个查询:路径分解为 O(logn)O(\log n) 段,每段计算 BB 位,每位的计算为 O(1)O(1),因此单次查询 O(Blogn)O(B \log n)。对于 q105q \le 10^5,总复杂度 O((n+q)Blogn)O((n+q)B \log n),在给定范围内可接受。

    正确性说明

    • 树链剖分保证任意路径可以被 O(logn)O(\log n) 条重链上的连续区间覆盖。
    • 因为异或运算按位独立,并且我们正确统计了每一位上节点值与下标不同的个数,因此累加后得到准确的总和。
    • 公式计算 onesones 时使用了闭区间上的计数,精确无误。
    • 向上段虽然节点顺序与链存储顺序相反,但 cnt1cnt_1 只依赖于节点集合(与顺序无关),而 onesones 依赖于顺序递增的下标,所以直接使用正向区间计算是正确的(因为正向区间对应的节点集合与逆向集合相同,只是排列不同,但下标 ii 的等差数列仍按全局顺序递增,不影响统计结果)。

    实现细节

    • 由于 ai5×105<220a_i \le 5\times 10^5 < 2^{20},且路径长度最多 5×105<2195\times 10^5 < 2^{19},所以 B=20B = 20 足够。
    • 为了节省内存,可以只存储每条重链的 2020 个前缀和数组,每条链的长度总和为 nn,总空间 O(nB)O(n \cdot B),约 5×105×20=1075\times 10^5 \times 20 = 10^7 个整数,内存约 4040 MB,在限制内。
    • 数学公式中需要用到 6464 位整数(因为 base+L1base+L-1 可能达到 10610^6 级别,但仍在 2312^{31} 内),使用 long long 即可。

    总结

    本题是树上路径异或求和问题,利用树链剖分转化为区间问题,再利用二进制拆位和数学公式快速计算每个区间内节点与等差数列的异或和。通过预处理每条重链上各二进制位的前缀和,可以在 O(lognlogmaxa)O(\log n \cdot \log \max a) 时间内回答每个查询,满足大数据范围的要求。

    • 1

    信息

    ID
    6936
    时间
    1000ms
    内存
    256MiB
    难度
    10
    标签
    递交数
    1
    已通过
    1
    上传者