卷积导向快速傅里叶变换(FFT/NTT)教程

卷积,导向,快速,傅里叶,变换,fft,ntt,教程 · 浏览次数 : 19

小编点评

**生成内容时需要带简单的排版** **1. 线性同态** * 定义域上的线性同态。 *证明同态关系。 **2. 多项式求逆** *定义多项式求逆。 *使用除法算法求逆。 **3. 环素数** *定义环素数。 *证明域上每个元素都是环素数的最小正整数。 **4. 同态** *证明域上的一元多项式环的同态。 *使用除法或特征定义。 **5. F 可逆** *证明 F 可逆时同态关系成立。 *使用特征或除法。 **6. 线性同态的证明** *证明在线性同态的构造。 *使用除法或特征定义。 **7. 多项式求逆的证明** *使用除法或特征定义。 *证明多项式求逆的性质。

正文

1 Forewords

卷积,但不止卷积 - FFT 漫谈

  • 先有 FT,再有 DFT,才有 FFT
  • 时频转换是最初的用途
  • 发现单位根优秀性质,James Cooley, John Tukey 发明现代 FFT 加速 DFT,但此前相似的发现早已有之
  • 后来将 DFT 与卷积定理联系,FFT 才被用于计算多项式乘法
  • 复数运算精度误差推动了 NTT 的发展
  • 应用:任何需要频率和卷积的地方.频谱、滤波器、音乐、雷达、图像处理……
  • OI/XCPC 中主要关心卷积

推荐食用方法

  • 初步要求

    • 知道 DFT、FFT 可用于快速计算多项式卷积
    • 掌握 FFT 加速 DFT 计算的原理和实现
    • 会应用结论改动 FFT 加速 NTT 计算
    • 见识一些卷积解决的基本问题,初步了解生成函数在组合计数中的应用
    • 题目可选择性完成,请多花时间消化原理和思想
  • 学有余力 / 集训后继续消化

    • 系统学习生成函数
    • 实现多项式全家桶
    • 对原理感兴趣的同学可对数学部分做进一步研究.本讲内容是线性代数、抽象代数、数论等多领域的综合应用.欢迎讨论.
    • 学习集合幂级数相关知识点(FMT,FWT,……),体会其思想与 FFT 的同与异
    • 学习 FFT 在信号、频谱等非算法竞赛向实际问题中的应用
  • Learn for fun :)

记号说明

  • [n]={0,1,,n1},此时可用 k[n] 代替下标取值范围 k=0,1,,n1 的记法.

    • 集合论中已定义 n={0,1,,n1},这里的中括号是为了强调其集合含义.
  • 使用 Iverson 括号约定:设 P 是一个命题,记 [P]:={1P is true0otherwise

  • 多项式的规模定义为多项式的次数加一.特别的,零多项式的规模为 0

    • 以后会混用 n1 次多项式和规模为 n 的多项式的说法.

2 FFT/NTT in a nutshell

2.1 FFT

多项式卷积

给定两个至多 n1 次的多项式 A(x)=k=0n1akxk,B(x)=k=0n1bkxk 如何快速计算两者的卷积,即它们相乘得到的多项式的系数? (AB)(x)=A(x)B(x)=i=0n1aixij=0n1bjxj=k=02n2xki+j=kaibj 上式给出了 O(n2) 的朴素做法.

系数 - 点值 - 系数

  • 代入任意 x 可得到多项式在 x 处的点值

  • 点值意义下的多项式乘法是 O(n)(AB)(x)=A(x)B(x)

  • n 点确定一个至多 n1 次的多项式

若计算至多 n1 次的多项式的某 n 个点值存在快速算法,而通过多项式的某 n 个点值确定原多项式系数亦存在快速算法,就有通过 O(n) 的点值乘法加速多项式乘法计算的可能.

系数 - 点值 - 系数 - 快速转换?

  • 朴素计算任意指定 n 个位置点值需要 O(n2)

  • Lagrange 插值给出了 O(n2) 将任意位置 n 个点值还原为多项式系数的算法.

  • 能否选取 n 个特殊的点值使系数 - 点值、点值 - 系数的变换支持快速计算?

Discrete Fourier Transform

离散傅里叶变换(Discrete Fourier Transform, DFT)接受一个至多 n1 次的多项式的 n 个系数,将复数域上的 nn 次单位根代入系数表达式以得到给定多项式的 n 个点值. a0,a1,,an1A(1),A(ωn),,A(ωnn1)

得益于单位根的特殊运算性质,二者均有被称为快速傅里叶变换(Fast Fourier Transform, FFT)的快速算法.

复数域单位根

复数域上的 nn 次单位根 ωnk:=e2πkni=cos2πkn+isin2πkn,k[n] 是复平面单位圆上的 n 等分点,易验证它们是复数域中唯一满足方程 zn=1 的解.

所有单位根模长均为 1.第 k 个单位根的辐角为 2πkn.复数乘法”模长相乘,辐角相加”的性质告诉我们 ωniωnj=ωni+j

Remark (Euler’s formula for nerds). Euler 公式 eit=cost+isint 的一种证明可用指数函数的另一定义 expz=limn(1+zn)n 分析复数处极坐标的极限 .严格来讲,如果三角函数和指数函数都由级数定义 ,Euler 公式几乎是显然的.总之,这里仅将 Euler 公式作为一种紧凑的记号使用,细节不做要求.

复数域单位根 - 三个重要性质

Theorem 1 (消去引理) ωdndk=ωnk,dN+

Theorem 2 (折半引理) {ω2n2k:k[2n]}={ωnk:k[n]}

消去 / 折半引理将在 FFT 的推导中使用.

复数域单位根 - 三个重要性质

Theorem 3 (求和引理) 1nk=0n1ωnik=[ni]

求和引理的证明使用了等比数列求和公式.将在 IDFT 的推导中用到.

Fast Fourier Transform

考虑将至多 2n1 次的待变换多项式 A(x)=k=02n1akxk 奇偶分项两个至多 n1 次的多项式 A(x)=A0(x2)+xA1(x2),其中 A0(x)=k=0n1a2kxk,A1(x)=k=0n1a2k+1xk 代入 x=ω2nk,k[2n],用单位根消去或折半引理(ω2n2k=ωnk)得 A(ω2nk)=A0(ωnk)+ω2nkA1(ωnk) 再用 ω2nn=1A(ω2nk)=A0(ωnk)+ω2nkA1(ωnk)A(ω2nn+k)=A0(ωnk)ω2nkA1(ωnk),k[n] 原多项式 A(x) 规模为 2n 的 DFT 转化为规模为 nA0(x)A1(x) 的 DFT.递归计算就可得到 O(nlogn) 的算法.

DFT 的矩阵表示

a=(a0a1an1),F=(ωnij)(i,j)n×n=(1111ωnωnn11ωnn1ωn(n1)(n1)) 则 DFT 的变换结果(给定系数 a0,a1,,an1 的多项式在 nn 次单位根处的点值)可表示为 a^=(A(1)A(ωn)A(ωnn1))=Fa

IDFT

由单位根的消去引理可证,DFT 矩阵 F 的逆矩阵为 F1=1n(ωnij)(i,j)n×n=1n(1111ωn1ωn(n1)1ωn(n1)ωn(n1)(n1)) 于是 IDFT 的过程可表示为 a=F1a^

故快速计算 IDFT 的方法与 FFT 几乎一致,只需将计算 DFT 时使用的本原单位根 ωn 替换为 ωn1 并对最终结果除以 n 即可.

梳理

  • 怎么计算卷积?

    • 把至多 n1 次的多项式 A(x) 和至多 m1 次的多项式 B(x) 写成至多 n+m2 次的多项式(高位补 0).为计算 FFT 方便,还要继续补 0 至一个大于其次数的 2 的幂.
    • A(x)B(x) 多点求值.
    • 把两个多项式的点值逐点相乘.
    • 多点插值还原 (AB)(x) 的系数.
  • 怎么快速求值?

    • 选点选单位根就是 DFT.
    • 消去引理和折半引理使我们可以用 FFT 算法递归地计算 DFT.
    • 推导已经给出了递归的写法,之后还会介绍常数更优的迭代实现.
  • 怎么快速插值?

    • 求和引理给出了 DFT 矩阵的逆矩阵.
    • 计算方法很相似,最后逐项除掉一个规模.

FFT 递归实现 - DFT 部分

方便起见,我们只处理 n2 的幂的情形.以下 C 风格的代码实现了递归的 DFT 和 IDFT.

#include<bits/stdc++.h>
#include<complex>
using namespace std;
typedef long long ll; typedef complex<double> CP;
const ll MXN=4E6+5; const double PI=3.14159265358979323846l;
CP tmp[MXN];
void _DFT(CP A[],ll n,ll typ){
    n/=2; if(n==0) return;
    for(ll k=0;k<n;k++) tmp[k]=A[2*k],tmp[n+k]=A[2*k+1];
    for(ll k=0;k<2*n;k++) A[k]=tmp[k];
    _DFT(A,n,typ); _DFT(A+n,n,typ);
    CP w(cos(2*PI/(2*n)),typ*sin(2*PI/(2*n))), wk=1;
    for(ll k=0;k<n;k++){
        tmp[  k]=A[k]+wk*A[n+k];
        tmp[n+k]=A[k]-wk*A[n+k];
        wk*=w;
    } for(ll k=0;k<2*n;k++) A[k]=tmp[k];
} void DFT(CP A[],ll n,ll typ){
    _DFT(A,n,typ); if(typ==-1) for(ll i=0;i<n;i++) A[i]*=1.0l/n;
}

FFT 递归实现 - 卷积部分

// alternatively, use std::__lg() in GCC
ll log2ceil(ll n){ll cnt=0; for(ll t=1;t<n;t<<=1) cnt++; return cnt;} 
CP A[MXN],B[MXN],C[MXN]; ll outC[MXN];
ll* conv(ll inA[],ll aN,ll inB[],ll bN){
    ll n=1LL<<log2ceil(aN+bN-1);
    for(ll i=0;i<aN;i++) A[i]=inA[i];
    for(ll i=0;i<bN;i++) B[i]=inB[i];
    DFT(A,n,1); DFT(B,n,1);
    for(ll i=0;i<n;i++) C[i]=A[i]*B[i];
    DFT(C,n,-1); for(ll i=0;i<n;i++) outC[i]=round(C[i].real());
    return outC;
}

Drawbacks?

  • 递归实现慢
  • 临时数组丑
  • 封装性为零

FFT 迭代

迭代地实现 FFT 不仅在常数上更加优秀,亦更便于使用 C++ 的容器进行封装.这并不困难,只需自底向上模拟 FFT 递归过程即可.

唯一的问题——最底层的顺序?

来观察一轮 23-FFT 自顶向下的置换过程 230/0001/0012/0103/0114/1005/1016/1107/111220/0002/0104/1006/1101/0013/0115/1017/111210/0004/1002/0106/1101/0015/1013/0117/111200/0004/1002/0106/1101/0015/1013/0117/111

你发现了什么?

蝶形运算

在计算点值前,2n-FFT 事实上完成了一次 n-位逆序置换.分解来看,规模为 2k 的层的置换完成了对 2nk 对应二进制位的分类.

我们有 O(n) 的递推方法获得这一置换.

void spawnrev(ll n){
    rev[0]=0;
    for(ll i=1;i<(1<<n);i++)
        rev[i]=(rev[i>>1]>>1)+((i&1)<<(n-1));
}

FFT 迭代实现

void DFT(CP A[],ll n,ll typ){ // rev[] should be spawned in advance
    for(ll i=0;i<n;i++) if(i<rev[i]) swap(A[i],A[rev[i]]); // a one-to-one permutation
    for(ll hf=1;hf<n;hf*=2){
        CP w(cos(2*PI/(2*n)),typ*sin(2*PI/(2*n))), wk=1;
        for(ll i=0;i<n;i+=hf*2){
            CP wk=1;
            for(ll k=0;k<hf;k++){
                CP x=A[i+k],y=wk*A[i+hf+k];
                A[i+k]=x+y; A[i+hf+k]=x-y;
                wk=wk*w;
            }
        }
    }
    if(typ==-1) for(ll i=0;i<n;i++) A[i]*=1.0l/n;
}

请自行实现更易用的容器封装版本.

2.2 NTT

NTT 速成

FFT 的缺点?浮点数带来的大常数与精度问题.

998244353=223×7×17+1,同时是一个质数.

我们指出,在系数和点值模 p=998244353 的意义下,当规模 np,至多 n1 次的多项式仍可由其 n 个点值唯一确定,故仍可使用系数-点值-系数的方法求得多项式卷积.

我们指出,对于满足 np1n,依 ωn:=3p1n 定义的 ωn 在模 p 意义下与复数域中定义的 ωn 发挥相同的作用,仍可进行规模至多为 223 的 FFT 作为模 p=998244353 意义下 NTT 的快速算法.

只需修改单位根定义,把复数运算改为整数取模,就得到了能算 NTT 的 FFT 的实现.

const PR=3,MOD=998244353;
ll w=qpow(PR,(MOD-1)/(hf*2)); if(typ==-1) w=inv(w);

FFT/NTT in a nutshell - 小结:概念区分

  • 关于 DFT

    • Discrete Fourier Transform, DFT, 离散傅里叶变换
    • Fast Fourier Transform, FFT, 快速傅里叶变换
    • FFT 是计算 DFT 的快速算法
  • 关于 NTT

    • Number Theoretic Transform, NTT, 数论变换
    • FFT 在复数域上的多项式环 C[x] 中进行,而 NTT 在模 p 剩余类域 Zp[x] 上进行
    • 快速计算 DFT / IDFT, NTT 都用 FFT,故一般不使用”FNTT”的说法

3 Applications

3.1 基本应用

基本应用

大整数乘法

十进制数可拆解为多项式表示,计算卷积后处理进位即可.由于数字最大只是 9,合理数据范围下卷起来不会爆模数,直接用 NTT 实现即可.

背包计数

两个背包的合并就是多项式卷积.

滤波器

反转多项式的系数数组再做卷积,可以快速得到两个多项式滑动窗口式的内积.

位运算

有些位运算可以写成卷积的形式.模 2 意义下”异或”是加法,“与”是乘法,“或”可以通过取反转化为”与”.

字符串

通过巧妙设定字符串距离函数,FFT 可解决更广泛的字符串匹配问题.

值域次数化

当值域较小时,将待计算的值放在多项式次数上统计贡献次数,可以绕开某些极难求解的数值问题.例如 Vandermonde 行列式的快速计算.

基本应用 - 分治 FFT

对多个长度相同的多项式的卷积,分治地卷起来可降低时间复杂度.长度不一时,挑小的先卷也可减小常数(用堆维护).

另有一种 CDQ 风格的分治 FFT.CDQ 长于处理带偏序的二元点对贡献,在处理形如 ck=i>j[i+j=k]aibj 的带偏序卷积时可以应用.

当卷积的前后项存在依赖关系时,也可使用此法保证处理顺序恰当.然而此类依赖问题往往也可通过解生成函数方程的方法求得封闭形式.

时间复杂度均为 T(n)=2T(n2)+O(nlogn)=O(nlog2n)

3.2 生成函数初步

生成函数初步 - 导言

生成函数是一种对数列的操作技巧.通过将数列表示为多项式或形式幂级数,数列间复杂的和式操作可用简单函数的乘法、复合等运算进行表示,从而大大降低了数列变换技巧的使用门槛.

生成函数在组合数学中应用广泛,且生成函数的部分操作在组合意义下也有较为直观的理解.本节将带大家初窥其中的奥妙.限于篇幅和主讲人能力,我们仅以题带点地讲解,期冀为大家建立构造生成函数的直觉.请感兴趣的同学下来做进一步研究.

熟悉 Taylor 展开的同学或能较快上手此部分内容.

Ordinary Generating Function

序列 an 的普通生成函数(Ordinary Generating Function, OGF)定义为其对应的多项式(形式幂级数)A(x)=n=0+anxn.这样书写的目的是为了便于进行数列间的卷积操作.特别的,Taylor 展开(或广义二项式定理)风格的 11x=1+x+x2+ 也是常用技巧之一

Exercise 1 写出下列数列的 OGF.下标从 0 开始.

  • 1,0,0,0
  • 1,1,1,1,
  • 1,0,1,0,
  • 1,1,1,1,
  • 1,2,3,4,
  • 1,2,4,8,

OGF 组合意义

OGF 相乘,是背包,是卷积,是两块无标号组合对象的有序拼接.

Exercise 2 写出下列计数问题的 OGF,均以 n 作为数列的下标.

  • m 个物品中选出 n 个的方案数.
  • 容量为 n 的背包装下体积分别为 aim 个物品的方案数.
  • 同上,但每个物品有无限个.
  • n 个无标号球放入 r 个有标号盒的方案数,要求盒非空.
  • 同上,但盒可空.
  • 将整数 n 分拆为若干正整数之和的方案数.

Exponential Generating Function

序列 an 的指数生成函数(Exponential Generating Function, EGF)定义为 A(x)=n=0+anxnn!

Exercise 3 写出下列序列的 EGF,下标从 0 开始.

  • 1,0,0,0,
  • 1,1,1,1,
  • 1,2,4,8,
  • 0,1,0,1,0,1,0,1,
  • 1,0,1,0,1,0,1,0,
  • 0,1,1,2!,3!,4!,

EGF 组合意义

观察两个 EGF 的乘积 A(x)B(x)=i=0+aixii!j=0+bjxjj!=i=0+j=0+aibjxi+ji!j!=n=0+i=0naibnixni!(ni)!=n=0+i=0naibni(ni)xnn! EGF 的乘积,相当于两块有标号组合对象的有序拼接.

EGF 组合意义

A(x)B(x)=i=0+aixii!j=0+bjxjj!=n=0+i=0naibni(ni)xnn!

Exercise 4 写出下列计数问题的 EGF,均以 n 作为数列的下标.

  • 长度为 n 的排列的构型数.
  • 长度为 n 的圆排列的构型数.
  • n 个有标号球放入 r 个有标号盒的方案数,要求盒非空.
  • n 个有标号球放入 r 个无标号盒的方案数,要求盒非空.
  • n 元集合划分为 r 个等价类的方案数.
  • 划分 n 元集合的方案数.

4 Mathematics behind

4.1 NTT 原理

NTT 原理 - 导言

本节介绍 NTT 的原理.

FFT 加速卷积算法的核心,一是多项式的求值插值原理,二是单位根带来的分治快速算法.我们将在本节中证明,模 p 剩余类域 Zp 中,只要 np,仍可通过 n 个点值唯一确定至多 n1 次的 Zp 上的多项式,这保证了系数-点值-系数方法的正确性;此外,基于原根构造出的 Zp 上的本原单位根,使得使用与 FFT 相同的分治算法加速 NTT 的计算成为可能.

NTT 原理涉及原根等数论内容.本讲的目标是建立 DFT 变换和 FFT 算法的通用数学框架,而非具体研究其某一特例.故我们只讲解 NTT 所需的基础数论知识,无关的细节则略过处理.对数论感兴趣的同学可前往 OI Wiki 学习.

p 剩余类域 Zp

p 剩余类域 Zp 是刻画取模运算下整数加法、乘法运算规律的代数结构,其良定义性由 {a1a2(modp)b1b2(modp){a1+b1a2+b2(modp)a1b1a2b2(modp) 保证.

p 剩余类域的最大特点是其中每个元素都存在(唯一)逆元.这一点是数论中 Bézout 定理的直接应用.

p 剩余类域的另一优良性质是其满足消去律,即 ab0(modp)a0b0(modp) 而模一般的数 m 形成的代数结构则不满足此性质.

Zp[x] 上的多点插值

之后记系数均在 Zp 上的多项式组成的集合为 Zp[x]

Lemma 1 (Zp[x] 上的多项式余式定理) A(x)Zp[x],用 Zp[x] 中的一次多项式 (xa)A(x) 进行带余除法,得到的余式为至多零次的多项式 A(a)

Zp[x] 上的多点插值

Theorem 4 (Lagrange 定理) p 是一个质数,设 A(x)Zp[x].同余方程 A(x)0(modp) 只有至多 degA(x) 个模 p 意义下不同的整数解,除非这多项式的系数全为零.

Corollary 1 A(x),B(x)Zp[x] 是至多 n1 次的两个多项式.若同余方程 A(x)B(x)(modp)n 个不同的模 p 意义下的整数解,则两多项式一定相等.

推论告诉我们,欲确定 Zp 上的一个至多 n1 次的多项式,只需找到其 n 个模 p 意义下的点值即可.因此,使用系数 - 点值 - 系数方法加速 Zp[x] 上的卷积是可行的.

单位

回顾 DFT 中复数域 C 上单位根的定义 ωnk:=e2πkni=cos2πkn+isin2πkn,k[n] 其中 ωn 是最重要的单位根,因为它生成了所有其它的单位根.

事实上所有的 ωnk:gcd(n,k)=1 也都是重要的,它们的 0n1 次方也能生成所有的单位根.这也是数论中 Bézout 定理的直接应用.

我们把这一类重要的单位根称为本原单位根.抽象的来说,n 次本原单位根 ωn 可定义如下 ωnn=1;ωnk1,k=1,2,,n1

Zm 上的阶

如何定义 Zm 上的“本原单位根”呢?

称在模 m 意义下使得 an=1 的最小正整数 na,记为 ordm(a).在不至混淆的情况下,也简记为 ord(a)

  • 阶最高有多高?

Theorem 5 (Fermat 小定理) p 是质数,a 是非零数,则 ap11(modp)

Theorem 6 (Euler 定理) gcd(a,m)=1,则 aφ(m)1(modm),其中 φ(m) 是数论中的 Euler 函数

Euler 定理的证明 - 简化剩余系

ZmR:={aZm:gcd(a,m)=1} 被称为 Zm简化剩余系.简化剩余系对模 m 乘法封闭.简化剩余系中的每个元素都具有模 m 意义下的唯一逆元,且其也在 ZmR 中.此二性质易由 gcd 的线性组合意义证明.

简化剩余系的大小即 φ(m).这是 Euler 函数的其中一种定义.

aZmR,其在 Zm 中存在逆元,故我们有 x,yZm,xy(modm)axay(modm) 当限定 x,yZmR 时,结合 ZmR 上述两个性质,就有 ZmR=aZmR={axmodm:xZmR}aφ(m)xZmRxxZmRaxxaZmRxxZmRxaφ(m)1(modm)

an 的取值 - a, m 互质时

补充讨论 anmodm,nZ+ 可取得哪些 Zm 中的元素.

gcd(a,m)=1 时,用 gcd 的线性组合含义,有 gcd(a,m)=1x0,ax0=1(modm)x0,anx0n=1(modm)gcd(an,m)=1 故此时 anmodm 只可能取得 Zm 的简化剩余系 ZmR 中的元素.

an 的取值 - 一般情况

d1=gcd(a,m)1 时,设 a=d1a1,m=d1m1,当 n1 时, anmodm=d1a1an1modd1m1=d1(a1an1modm1) 此时 gcd(a1,m1)=1,根据线性同余方程理论,括号内表达式的取值集合仅与 an1modm1 有关.此时若 d2=gcd(a,m1) 仍不等于 1,则令 a1=d2a2,m1=d2m2.类似地继续化归,最终有 dk+1=gcd(a,mk)=1anmodm=d1(a1d2(ak1dk(akankmodmk))modm1) 故当 nk 时,anmodm 的取值集合为 {d1d2dk(atmodmk):tZ+}d1d2dkZmkR 事实上,i=1kdi 恰为 gcd(a,m) 的各素因子在 m 中全部成分的乘积.

原根

需要注意的是,Euler 定理只给出了 Zm 上元素阶的一个上界.换言之,其说明 aZmRordm(a)φ(m) 而对于那些使得 gcd(a,m)1 的元素 a,用 gcd 的线性组合性质容易证明其永远不可能通过自乘变为 1.我们设定这类元素的阶为 0

Zm 上那些确能达到阶数上界 φ(m) 的元素是 Zm 上的原根,用符号 g 表示.

Theorem 7 (原根存在定理) Zm 上存在原根,当且仅当 m=2,4,pα,2pα ,其中 p 是一奇质数.

求阶和原根

  • 求阶,用定理 ordm(a)φ(m),求因子 + 快速幂即可 O(mlogm)
  • 找原根,从小到大用上述求阶方法暴力即可.最小原根一般不会太大.
  • 更快的方法请参考洛谷求原根模板题题解.

下面再介绍原根的两个定理.

Theorem 8 (原根判定定理) gcd(g,m)=1,则 gZm 上原根的充要条件是,对 φ(m) 的每个素因数 p,都有 gφ(m)p1(modm).

必要性显然.充分性,反证出所有 φ(m) 的非平凡因子均不是 g 的阶即可.

Theorem 9 (原根个数定理) Zm 上存在原根,则它原根的个数为 φ(φ(m)).

Zm 上的本原单位根构造

aZm 上一元素,当 nordm(a),令 ωn=aordm(a)n,容易发现 ωn 就是 Zm 上的 n 次本原单位根.

使用数论中 Bézout 定理,ωnkZm 上的 ngcd(n,k) 次本原单位根.这是 Zm 上本原单位根的消去引理

遗憾的是,一般的 Zm 中,本原单位根不一定满足求和引理 1nk=0n1ωnik=[ni].这是因为,求和引理的证明中使用了等比数列求和和消去律,但一般的 Zm 中消去律并不成立

Zm 上的 NTT - m 是质数

求和引理是保障 NTT 逆变换对应矩阵确为 n1(ωnij)(i,j)n×n 的关键性质.如果我们还想保留这一点,就必须要求 m 是质数.

为保证 nZm 中存在逆元,必须要求 gcd(n,m)=1.已经要求 m 是质数,故无需做出额外要求.

综上,逆变换矩阵确为 n1(ωnij)(i,j)n×nn 点 NTT 要求 m 是质数,且 nordm(a).已经要求 m 是质数,故 Zm 中必存在原根,不妨直接取 Zm 的一个原根 g 构造 n 次本原单位根 ωn=gφ(m)n=gm1n,这样的构造支持至多 m1 次单位根的存在,显然是最优的选择.

Zm 上的 FFT 与卷积加速 - 998244353

为满足 FFT 对 2m 次本原单位根的需求,只需选择 p=k2m+1 型的奇质数 p,就可以在 Zp 上支持规模至多为 2m 的 NTT/FFT 及其逆变换运行.

998244353=223×7×17+1,同时是一个质数,在 int 型中的单次加减操作不会溢出,是 OI/XCPC 计数题中不可多得的优秀模数

结合前述关于 Zp[x] 上多点插值的讨论,通过 NTT/FFT 加速卷积运算的正确性得到完整证明.

Zm 上的 NTT - 对一般的 m

m 不一定是质数时,NTT 逆变换不能表示为 n1(ωnij)(i,j)n×n 的形式.但这并不代表 NTT 不可逆.因此,尽管不再实用,一般 Zm 上的 NTT 变换仍有讨论价值,即研究 (ωnij)(i,j)n×n 的可逆性.

我们找到一篇有关该问题的参考文献,但尚不确定其证明的正确性.友情提示读者:Zm 不是域,甚至不是整环,故线性空间中矩阵的性质不能直接应用于 Zm 上的矩阵,讨论可逆性时还需小心谨慎.

从分析到代数

后续数学内容导读 NTT 原理虽已非常”数学”,但也只是 DFT 在有限域上的一个实例.本节往后,我们要尝试为多项式系数位于复数域 C 上的 DFT、位于模 p 剩余类域 Zp 上的 NTT 及它们的快速算法 FFT 建立一个统一的数学框架.这需要我们剖析求值插值的基本原理,提炼出 FFT 算法成立的根本要求.

后续数学内容不再要求掌握.望同学们在纷繁的定理定义中抓住要旨,窥见抽象数学背后蕴藏的规律.熟悉高等代数和抽象代数的同学或会对某些内容感到熟悉.抽象地讨论 FFT 的资料并不多见,后续内容多为主讲人的新进探索,或有谬误,望不吝指正.

4.2 求值与插值

求值与插值 - 导言

本节将重新审视已经熟知的多项式,把抽象的、代数的多项式和具体的、分析的多项式函数区分开来.我们指出,多项式和多项式函数不同但关联紧密,形式幂级数与幂级数亦有此类联系.这些抽象的讨论将帮助我们剖析多项式求值插值的基本原理.

除常见代数书目(如),也推荐参考 OI Wiki 的多项式基础和 Wikipedia 的形式幂级数

多项式

设(无穷)序列 {an} 是一个只有有限个非零项的序列,其元素均在环 R 上.环 R 上的多项式环[^14] R[x] 是所有满足上述条件的序列构成的集合以及在它们之间定义的两种运算 +,× 的合称.此语境下,我们也将构成 R[x] 的序列称为 R 上的多项式.序列中的元素被称为多项式的系数.序列间定义的加法和乘法是普通序列升级为多项式的关键.

多项式环上的加法、乘法的定义已经为大家所熟知.系数所处的环保证了多项式加法和乘法的良定义,而在这两种运算下,R 上多项式的集合也构成一个环的结构.

Remark (群、环、域). 群、环、域都是常见的代数结构,其中的元素在给定运算下封闭,并满足特定的运算性质.简单来说,环上定义了加法和可能不可逆的、不一定交换的乘法,域上定义了加减乘除所有四则运算.交换环中的乘法满足交换律.除环中的所有元素有乘法逆元.域是交换除环.

多项式

习惯上也会将多项式 A 写为 A(x)=k=0n1akxk 的形式.其中未定元 x 只是一个符号,仅为方便加、乘法的理解而使用,并无任何含义.

多项式 A次数 degA 定义为其最高非零项所处的位置下标.特别的,定义零多项式的次数为 .对任意多项式 A,BR[x]deg(A+B)max{degA,degB}.当 R 是整环时,A,B 的首项乘积非零,故 deg(AB)=degA+degB

下面额外为多项式定义一种新的运算.多项式 A 和多项式 B复合 AB 定义为 AB:=k=0+akBk 其中 Bk 代表 k 个多项式 B 的乘积.习惯上也会将多项式 A 和多项式 B 的复合写为 A(B(x))=k=0+akBk(x) 的形式.由于多项式的次数有限,复合运算中仅包含了有限次多项式加法和乘法.

形式幂级数

形式幂级数定义与多项式的唯一区别是其不要求 {an} 只有有限项非零.类似的,R 上的形式幂级数环记为 R[[x]]

由于涉及无限次运算,形式幂级数的复合运算需考虑环 R 上的收敛问题.为回避此问题,一般规定复合右侧函数的常数项须为零.

Remark. DFT, NTT 与多项式环 DFT/FFT 加速的多项式卷积在复数域 C 上的多项式环 C[x] 中进行,NTT/FFT 加速的多项式卷积在模 p 剩余类域 Zp 上的多项式环 Zp[x] 中进行.

带余除法

整环是无零因子的交换幺环.所谓无零因子,即环中任意元素 a,b 满足 ab=0a=0b=0.所有域都是整环.当 R 是整环时,R[x] 也是整环.整环上可以定义整除相关理论.

定义有带余除法的环被称为 Euclid 整环.域上的多项式环都是 Euclid 整环.值得注意的是,R 的 Euclid 性不可传递至 R[x]

如在带余除法中保证除式是首一多项式,则带余除法的良定义和进行过程也均可在整环上实现.

多项式函数 / 幂级数

刚刚强调,多项式 / 形式幂级数只是定义了加法和乘法的序列.现在介绍多项式函数和幂级数.它们不是序列,而是映射

多项式 A 对应的环 R 上的多项式函数 A(x) 定义为映射 A:RR,xk=0+akxk 其中 {an} 只有有限项非零.环 R 上的幂级数则无此限制

与多项式 / 形式幂级数不同,这里的 xR 代表函数的自变量,是会按环 R 上运算法则参与运算的有意义的变量.

多项式函数的加法和乘法定义为函数的加法和乘法,即 A+B:xA(x)+B(x)AB:xA(x)B(x)

求值

多项式和多项式函数似乎在许多情况下有着平行的关系.下面介绍一个较直观的结论.

若环 R 是交换环,则环 R 上每个多项式都唯一确定一个 R 上的多项式函数,且该映射保持加法和乘法运算.形式化地可以记为 (A+B)(x)=A(x)+B(x)(AB)(x)=A(x)B(x) 可用于证明上述结论的定理证明见.由于多项式的复合由多项式加法和乘法组成,而多项式函数的复合(定义为函数的复合)亦可在环上平行地展开,故上述映射也保持了复合运算.

多项式和多项式函数的这一关系为多项式在任意点的求值操作提供了理论基础.在多项式函数的 t 处求值也被称为用 t 代入多项式 A,记为 A(t)

插值

需要注意的是,前述结论的逆命题不一定成立,即R 上的一个多项式函数不一定与 R 上多项式一一对应.一个经典反例是有限域上多项式环 Zp[x] 上的 (x+1)pxp+1(modp).我们指出其成立的一个充分条件是 R 是无限整环

该逆命题的本质是通过多项式函数的所有函数值反过来确定多项式(系数)的过程.而如果在确定时只使用一部分函数值,就是所谓的多点插值过程.很多时候待求多项式的次数是已知的,这在相当程度上缩小了待定多项式的范围.我们指出,只要 R 是整环,就可以通过多项式任意 n 个不同位置的点值确定一个至多 n1 次的多项式.

证明的关键是用带余除法讨论多项式根与其一次因式的关系,即多项式余式定理或小 Bézout 定理

需要强调,上述结论只能说明,只有那些确实可通过多项式 n 点求值得到的点值组,才能与多项式建立保持加法和乘法运算的双射.对于任取的 R 中的一个 n 元组,则无法确定是否存在与之对应的多项式.

求值与插值的线性表示

到这里,多项式的求值与插值的线性表示已经呼之欲出了.若将交换环 R 上的至多 n1 次的多项式看做模 Rn 中的一个向量,则多项式多点求值的过程就是 Rn 上的一个线性变换(记为 V),其矩阵表示正是 Vandermonde 矩阵.由先前对求值的讨论,我们还知道其保持模 Rn 上的加法运算,并将结果不超过 n1 次的卷积运算转化为 Rn 上的逐项乘法.

若将对 R 的要求加强到域,注意到 Vandermonde 行列式在参数互不相同时非零,故此时 V 可逆.事实上,Vandermonde 矩阵求逆的过程就是 Lagrange 插值,从而给出了将任意 Rn 中向量还原为其对应多项式的构造方法.这与数论中中国剩余定理的构造有异曲同工之妙

求值与插值 - 小结

本节的核心是多项式和多项式函数的区别与联系,两个方向的”确定”分别给出了多项式多点求值和多点插值的理论基础.

由于多项式和多项式函数这种若即若离的关系,往往在记号上也有意无意地混淆了它们,某些情况下加大了区分的难度.本篇使用的记号体系将尽量用单个字母 A 表示多项式,用 A(x) 表示多项式 A 对应的多项式函数,用 A(t) 表示用 t 代入多项式 A,同时在需要区分的符号前加上适当的名词.

4.3 环上的 DFT

环上的 DFT - 导言

前面讨论了在多项式任意点处求值插值的基本原理,但 DFT/FFT 的运行只需在单位根处求值和插值.本节将进一步放宽对多项式环的限制,介绍定义在有主要单位根的环上的一般的 DFT 及其快速算法 FFT.

本节内容主要参考了

环上的单位根 - 两个定义

定义环 R 上的 n主要单位根(principal n-th root of unity)ωn 是满足如下条件的环 R 中的一个元素: ωnn=1;k=0n1ωnik=0,i=1,2,,n1 由定义立得 k=0n1ωnik=[ni]n,可见主要单位根的定义即求和引理本身.

定义环 R 上的 n本原单位根(primitive n-th root of unity)ωn 是满足如下条件的环 R 中的一个元素: ωnn=1;ωnk1,k=1,2,,n1

本原单位根在许多情况下与主要单位根等价,但亦非完全相同.

环上的单位根 - 区别与联系

Proposition 1 若环 R 是整环,则环上的本原单位根也是一个主要单位根.

Proof. 对任意正整数 i[n],令 S=k=0nωnik,则 (1ωni)S=SωniS=1ωnn=0,由 R 是整环及 ωni=0S=0

环上的单位根 - 区别与联系

Proposition 2 若环 R 的特征 charR 满足 charRn,则环上的主要单位根也是一个本原单位根.

Proof. 反证.若存在一正整数 i[n] 使得 n 次主要单位根 ωn 的某一幂次 ωni=1,则 k=0n1ωnik=k=0n11k=n10,与主要单位根定义矛盾.

环上的单位根 - 其它性质

分别根据定义和数论中的 Bézout 定理,容易证明主要单位根和本原单位根的消去引理:设 ωn 是环上的 n 次主要(本原)单位根,则 ωnk 是环上的 ngcd(n,k) 次主要(本原)单位根.

注意到 (ω2nn)2=1(ω2nn+1)(ω2nn1)=0,故整环上的 2n 次主要单位根或本原单位根 ω2n 均满足 ω2nn=1

环上的 n 次主要单位根或本原单位根 ωn 都存在逆元 ωn1=ωnn1

环上的 DFT

ωn 是环 R 上的一个 n 次主要单位根,其对应的 Rn 上的 n 点 DFT 定义为线性映射(或矩阵) F=(ωnij)(i,j)n×n=(1111ωnωnn11ωnn1ωn(n1)(n1))n1 在环 R 中存在乘法逆元,则 Rn 上的 DFT 可逆,其逆映射为 F1=(n1)1(ωnij)(i,j)n×n=(n1)1(1111ωn1ωn(n1)1ωn(n1)ωn(n1)(n1))

环上的 FFT

除无法在任意环上使用 ω2nn=1,现有的抽象已足够让我们写出与之前类似的推导 FFT 的过程.

R 是任意环,ω2n 是环 R 上的一个 2n 次主要单位根.由主要单位根的消去引理,ω2n2 是环 R 上的 2ngcd(2n,2)=n 次主要单位根.方便起见,记 ωn=ω2n2

考虑对模 R2n 中向量 a=(a0,a1,,a2n1)Tω2n 对应的 2n 点 DFT 变换,得到向量 a^=(a^0,a^1,,a^2n1)T,其中 a^i=k=02n1akω2nik.将其奇偶分项为 a^i=A0(i)+A1(i)ω2ni,其中 A0(i):=k=0n1a2kωnik=k=0n1a2kω2n2ikA1(i):=k=0n1a2k+1ωnik=k=0n1a2k+1ω2n2ik

环上的 FFT

注意到 A0(i)=A0(n+i)A1(i)=A1(n+i),故 a^i=A0(i)+A1(i)ω2nia^n+i=A0(i)+A1(i)ω2nn+i,i[n]A0(i),i[n] 的计算即计算向量 a0=(a0,a2,,a2n2) 对应于 ωnn 点 DFT 的过程;A1(i),i[n] 的计算即计算向量 a1=(a1,a3,,a2n1) 对应于 ωnn 点 DFT 的过程.

因此,令 n=2m,则只要环 R 上存在 2m 次主要单位根,如上形式的 FFT 递归算法就可在 O(nlogn) 的时间复杂度内快速计算 Rn 上的 n 点 DFT.而若 2k1,0kmR 内均存在逆元,Rn 上的 n 点 IDFT 也可类似地快速计算.

4.4 循环卷积与卷积定理

循环卷积与卷积定理 - 导言

上一节中,我们建立了在有主要单位根的环上的 DFT 及其快速算法 FFT 的相关理论,但由于放宽了对多项式环 R[x] 的限制,多项式的求值插值理论无法在此直接得到应用,环上 DFT 加速多项式卷积的理论尚需重新构建.

在求值与插值部分已经介绍求值变换 VRn 上的线性表示,其保持 Rn 上的加法运算,并将规模不超过 n 的两向量的卷积转化为 Rn 上的逐项乘法.本节中,我们来证明 DFT 变换 F 也满足同样的性质,且将这一结果推广到卷积规模超过 n 时的情况.

循环卷积

R交换环,我们记 AB 代表模 Rn 上两个向量的逐项乘法.

FRn 上主要单位根 ωn 对应的 n 点可逆 DFT 变换,A,BRn 中两个任意取定的向量.显然 F(A+B)=FA+FB,故 DFT 变换保持 Rn 上的加法运算.现在的主要问题是,求值与插值部分计算卷积的方法 F1(FAFB) 在放宽环限制的 Rn 上进行时,将会得到什么结果?

a^=Fa,b^=Fbc^=a^b^,c=F1c^a^i=j=0n1ajωnij,b^i=k=0n1bkωnik

循环卷积

c^i=a^ib^i=j=0n1ajωnijk=0n1bkωnik=j=0n1k=0n1ajbkωni(j+k) ci=t=0n1ωnitc^t=t=0n1ωnitj=0n1k=0n1ajbkωnt(j+k)=j=0n1k=0n1ajbkt=0n1ωnt(j+ki) 对最里侧的求和使用主要单位根的定义(求和引理),就有 ci=j=0n1k=0n1ajbk[nj+ki]=j+kimodnajbk 这便是所谓的循环卷积.以后将 Rn 中向量 ab 的循环卷积记为 ab.形象地来看,循环卷积中,次数超过 n1 的卷积项被模意义地地叠加到了以次数为 0 为始的项上.

卷积定理

前述讨论已经证明 F(AB)=FAFB 这便是一般交换环上 DFT 变换的(循环)卷积定理.

我们指出,当要求所作变换可逆时,卷积定理反过来也要求所作变换是一类似 DFT 映射的变换

Exercise 5 尝试将任意序列 DFT 两次,观察结果.证明你的结论.

Exercise 6 求 DFT 矩阵的行列式.尽可能缩小可行解范围.

5 Advanced Operations

多项式全家桶 - 序言

  • 有哪些?

    • 求逆、开根、对数、指数、快速幂、复合等
  • 咋推的?

    • 求解思路几乎都是倍增,时间复杂度几乎都是大常数 O(nlogn)
    • Newton 迭代法是推导全家桶迭代公式的通法
    • 严格化需要进一步的形式幂级数理论,主讲人不会
  • 有啥用?

    • 当你一波操作化出生成函数发现不会求系数
  • 怎么讲?

    • 受限于篇幅和主讲人能力,我们讲不完
    • 只讲求逆和对数,其余请左转 OI Wiki

多项式求逆

给定一多项式 A(x),求解满足 A(x)B(x)=1(modxn) 的多项式 B(x)

多项式逆元存在的充分必要条件是其常数项非零(这是因为边界条件 b0=1a0),若存在则在模意义下一定唯一.这结论可直接由下述求解方法得到.不失一般性,只研究 A(x) 的次数至多为奇数 2n1 的情况.设 A(x)=A0(x)+xnA1(x)B(x)=B0(x)+xnB1(x) 考虑递归地在已知 A(x)B0(x)=A0(x)B0(x)=1(modxn) 的基础上求解 A(x) 的逆元.先指出该方法的时间复杂度为 T(n)=T(n2)+O(nlogn)=O(nlogn)

多项式求逆

以下简记 A(x)A,其它多项式同理.注意到 {AB0=1(modxn)AB=1(modxn)A(BB0)=0(modxn) 由于 Amodxn 非零,故 BB0=0(modxn) 这也说明,多项式逆元在模不同 xn 下的前缀保持一致.

两边平方得 B22BB0+B02=0(modx2n) 两侧同乘 A 并移项得 B=2B0AB02(modx2n)

多项式求逆 - 实现

Poly inv(const Poly &A){
    ll n=A.len(); Poly B(1); B[0]=inv(A[0]);
    for(ll hf=1;hf<n;hf<<=1){
        B=B*2-B*B*A.subpoly(0,hf*2); B.resize(hf*2);
    } B.resize(n);
    return B;
}
  • 常数巨大的写法,仅作演示,请勿学习.
  • 正确的写法是在 DFT 后的点值上操作多项式,请小心实现封装.

多项式 ln

给定一多项式 A(x),求解满足 B(x)=lnA(x)(modxn) 的多项式 B(x)

次数为 + 的形式幂级数的 ln 存在的充分必要条件为其常数项非零(这是因为边界条件 b0=lna0),同样一旦存在则唯一.注意到仅整数 a0=1 时,lna0 可取得整数,故合理的 a0 只能是 1

推导是容易的.方程两侧同时求导得 B(x)=A(x)A(x)(modxn1) 两侧再积分得 B(x)=A(x)A(x)dx+C(modxn) 其中 C=lna0.多项式求逆、求导、积分即可.时间复杂度 O(nlogn)

多项式 ln - 实现

Poly drv(Poly A){ // derivative
    for(ll i=0;i<A.len();i++) A[i]=(i+1)*A[i+1]_;
    A.pop_back(); return A;
}
Poly itg(Poly A,ll c){ // integral
    A.push_back(0); for(ll i=A.len();i>=1;i--) A[i]=A[i-1]*inv(i)_;
    A[0]=c; return A;
}
Poly ln(const Poly &A){
    return itg((drv(A)*inv(A)).subpoly(0,A.len()-1),0/*log(A[0])*/);
}

Acknowledgements

  • 感谢 keke_046 学长教授 FFT、集合幂级数与生成函数.微言大义,博大精深,至今仍在消化.

  • 感谢队友 ItzDesert 提供位运算典题一道并提供内容编排建议.

题单

主讲人练题少,仅供参考.

模板
大整数乘法
  • 洛谷 P1919 【模板】A*B Problem 升级版(FFT 快速傅里叶变换)
基础计数
  • SPOJ-TSUM Triple Sums

  • BZOJ3513-MUTC2013 Idiots

    上面两道题都是 OGF 消序,较 EGF 消序困难.一般的方法是使用 Polya 计数原理.

位运算
  • ABC291G OR Sum

    也是滤波器的应用.

分治 FFT
  • 百度之星 2023 初赛第二场 T8

    容斥后需要计算若干一次多项式乘积,分治 NTT 即可.

  • 百度之星 2023 初赛第一场 T6

    i>jaiai+aj.值域次数化后 CDQ 处理偏序.

  • 洛谷 P4721 【模板】分治 FFT

    CDQ 偏序化处理前后项依赖.也可解生成函数方程再多项式求逆.

字符串
  • ABC196F Substring 2

  • 洛谷 P4173 残缺的字符串

    带单字符通配符的字符串匹配.体会设定字符串距离函数的方法.

全家桶
  • 洛谷 P4721 【模板】分治 FFT

    体验生成函数简化复杂数列递推的威力.

  • 洛谷 P4389 付公主的背包

    解决此问题的方法也可用于分拆数计算.

  • 洛谷 P4841 【集训队作业2013】城市规划

    EGF 消序划分典题.体验生成函数风格的计数方法.

  • LOJ6538 烷基计数 - 加强版 - 加强版

    对生成函数使用的 Polya 计数.

    Polya ex. 苯环碳接 C4H9 同分异构体计数

其它
  • QOJ5748-UCUP2023-Stage7-K Determinant, or...?

    看似人畜无害的 (aiorj)(i,j)n×n 行列式求值,解法的背后却潜藏 FMT 的思想.此类行列式与各类反演、卷积有密切联系,我们给出一篇研究了其与偏序集上反演的关系的参考文献,欢迎讨论.

References

[1]
OI-Wiki, “拉格朗日插值.” https://oi-wiki.org/math/numerical/lagrange/.
[2]
张筑生, “数学分析新讲(重排本)(第二册),” 2nd ed.北京: 北京大学出版社, 2021, pp. 256–262.
[3]
杨树森, “三角函数的严格定义.” https://zhuanlan.zhihu.com/p/58814328/, 2023.
[4]
T. H. Cormen, C. E. Leiserson, R. L. Rivest, and C. Stein, “算法导论(原书第三版),” 北京: 机械工业出版社, 2013.
[5]
[6]
[7]
R. Agarwal and C. Burrus, “Fast convolution using fermat number transforms with applications to digital filtering,” IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 22, no. 2, pp. 87–97, 1974, doi: 10.1109/TASSP.1974.1162555.
[8]
丘维声, “高等代数 下册,” 3rd ed.北京: 高等教育出版社, 2015.
[9]
OI-Wiki, “多项式与生成函数简介.” https://oi-wiki.org/math/poly/intro/.
[10]
Wikipedia, “Formal power series.” https://en.wikipedia.org/wiki/Formal_power_series.
[11]
Wikipedia, “Lagrange polynomial.” https://en.wikipedia.org/wiki/Lagrange_polynomial.
[12]
M. Fürer, “Faster integer multiplication,” SIAM Journal on Computing, vol. 39, no. 3, pp. 979–1005, 2009, doi: 10.1137/070711761.
[13]
Wikipedia, “Discrete fourier transform over a ring.” https://en.wikipedia.org/wiki/Discrete_Fourier_transform_over_a_ring.
[14]
I. Baraquin and N. Ratier, “Uniqueness of the discrete fourier transform,” Signal Processing, vol. 209, p. 109041, 2023.
[15]
H. S. Wilf, “Hadamard determinants möbius functions, and the chromatic number of a graph,” 1968.

Footnotes

  1. 一种常见的证法是使用 Vandermonde 行列式证明矩阵可逆.后面会介绍多项式环风格的证明.↩︎

  2. 有的文献定义 ωn:=e2πni,或是因为信号处理领域常用 IDFT 将信号时域采样数据变为频域信息.事实上,DFT/IDFT 的说法也常有反转,但这只是形式问题.↩︎

  3. 这三个引理是《算法导论》 引入的.↩︎

  4. 这也表明适当归一化后的 DFT 矩阵是一个酉矩阵.↩︎

  5. NTT 原理需较多笔墨,稍后介绍.↩︎

  6. 否则只有 p 个不同元素的 Zp 中根本取不到 n 个不同位置的点值.后面会深入讨论.↩︎

  7. 多项式求逆等多项式进阶操作,我们后续讲解.↩︎

  8. 对质数 pφ(p)=p1.故 Euler 定理是 Fermat 小定理的一个推广.↩︎

  9. ExBSGS 求解离散对数 的推导与此相似.↩︎

  10. 部分证明稍复杂,我们略过处理.感兴趣的同学请参考 OI Wiki ↩︎

  11. 这是后文所述定理“整环上的本原单位根也是主要单位根”在一般环上的一个反例.↩︎

  12. 网传此模数由 UOJ 站长 vfleaking 提出并推广.在所有需要取模的题目中使用该模数,可使选手无法通过模数判断题目的做法.↩︎

  13. 本篇中环的定义包含乘法单位元,即幺环.↩︎

  14. 无零因子的交换幺环,稍后介绍.↩︎

  15. 可用前述多项式乘积次数公式证明.↩︎

  16. 试试在 Z[x] 上用 2x+1 去除 x+1↩︎

  17. 首项为 1 的多项式.↩︎

  18. 函数和映射几乎是等价名词.有时函数特指值域包含于复数域 C 的映射.↩︎

  19. 为良定义 x0,环 R 必须有单位元.↩︎

  20. 这里再次涉及环 R 上的收敛问题.由于实践中只关心形式幂级数的前有限项,后续讨论系数-点值-系数法转换卷积时不需要用到幂级数理论,可以回避.↩︎

  21. 这种保持结构不变的映射被称为同态(homomorphism).↩︎

  22. 其证明了域上一元多项式环的通用性质.仿照该证明应可证明环上的版本,从而证明这一同态关系.↩︎

  23. 该定理是下方高亮定理的一个自然的推论.↩︎

  24. 由于一次因式均为首一多项式,可以在整环上对其使用带余除法.↩︎

  25. 模是定义在环上的“线性空间”.↩︎

  26. Lagrange 插值的构造用到了除法,且行列式非零推出矩阵可逆仅在域上的线性空间中适用,因此必须要求 R 是域.↩︎

  27. 使得 m1=k=0m11=0 的最小正整数 m.不存在则记为 0charC=0charZp=p.可以证明域的特征一定是 0 或一质数↩︎

  28. 证明使用主要单位根的定义(求和引理)即可.↩︎

  29. 虽然前面用到了 F 可逆的要求,但该定理在 F 不可逆时也成立.只需类似地验证两边相等即可.↩︎

  30. 具体来说,该变换只能是 DFT 矩阵的某个行置换.在 Cn 上的证明可参见,主讲人目前正在研究整环上的版本,欢迎讨论.↩︎

与卷积导向快速傅里叶变换(FFT/NTT)教程相似的内容:

卷积导向快速傅里叶变换(FFT/NTT)教程

1 Forewords 卷积,但不止卷积 - FFT 漫谈 先有 FT,再有 DFT,才有 FFT 时频转换是最初的用途 发现单位根优秀性质,James Cooley, John Tukey 发明现代 FFT 加速 DFT,但此前相似的发现早已有之 后来将 DFT 与卷积定理联系,FFT 才被用于计

一文全解:LVM(逻辑卷管理器)

一般而言,在生产环境中无法在最初时就精确地评估每个硬盘分区在日后的使用情况,因此会导致原先分配的硬盘分区不够用。比如,伴随着业务量的增加,用于存放交易记录的数据库目录的体积也随之增加;因为分析并记录用户的行为从而导致日志目录的体积不断变大,这些都会导致原有的硬盘分区在使用上捉襟见肘。硬盘分好区或者部...

卷积神经网络-AlexNet

AlexNet 一些前置知识 top-1 和top-5错误率 top-1错误率指的是在最后的n哥预测结果中,只有预测概率最大对应的类别是正确答案才算预测正确。 top-5错误率指的是在最后的n个预测结果中,只要预测概率最大的前五个中含有正确答案就算预测正确。 max-pooling层 最大池化又叫做

头疼!卷积神经网络是什么?CNN结构、训练与优化一文全解

> 本文全面探讨了卷积神经网络CNN,深入分析了背景和重要性、定义与层次介绍、训练与优化,详细分析了其卷积层、激活函数、池化层、归一化层,最后列出其训练与优化的多项关键技术:训练集准备与增强、损失函数、优化器、学习率调整、正则化技巧与模型评估调优。旨在为人工智能学者使用卷积神经网络CNN提供全面的指

总结了6种卷积神经网络压缩方法

摘要:神经网络的压缩算法是,旨在将一个庞大而复杂的预训练模型(pre-trained model)转化为一个精简的小模型。 本文分享自华为云社区《卷积神经网络压缩方法总结》,作者:嵌入式视觉 。 我们知道,在一定程度上,网络越深,参数越多,模型越复杂,其最终效果越好。神经网络的压缩算法是,旨在将一个

CoordConv:给你的卷积加上坐标

摘要:本文主要对CoordConv的理论进行了介绍,对其进行了复现,并展示了其在网络结构中的用法。 本文分享自华为云社区《CoordConv:给你的卷积加上坐标》,作者: 李长安。 一、理论介绍 1.1 CoordConv理论详解 这是一篇考古的论文复现项目,在2018年作者提出这个CoordCon

使用卷积神经网络实现图片去摩尔纹

摘要:本项目主要介绍了如何使用卷积神经网络去检测翻拍图片,主要为摩尔纹图片;其主要创新点在于网络结构上,将图片的高低频信息分开处理。 本文分享自华为云社区《图片去摩尔纹简述与代码实现》,作者: 李长安。 1前言 当感光元件像素的空间频率与影像中条纹的空间频率接近时,可能产生一种新的波浪形的干扰图案,

基于卷积神经网络的MAE自监督方法

本文介绍ICLR2023的方法Spark,实现了基于CNN的MAE。

基于深度卷积神经网络的时间序列图像分类,开源、低功耗、低成本的人工智能硬件提供者

具体的软硬件实现点击 http://mcu-ai.com/ MCU-AI技术网页_MCU-AI人工智能 卷积神经网络(CNN)通过从原始数据中自动学习层次特征表示,在图像识别任务中取得了巨大成功。虽然大多数时间序列分类(TSC)文献都集中在1D信号上,但本文使用递归图(RP)将时间序列转换为2D纹理

使用Python的一维卷积

学习&转载文章:使用Python的一维卷积 背景 在开发机器学习算法时,最重要的事情之一(如果不是最重要的话)是提取最相关的特征,这是在项目的特征工程部分中完成的。 在CNNs中,此过程由网络自动完成。特别是在早期层中,网络试图提取图像的最重要的特征,例如边缘和形状。 另一方面,在最后一层中,它将能