- 前言
- Fast Fast TLE
- 一、FFT是什么?
- 二、FFT可以干什么?
- 1. 多项式乘法
- 2. 大数乘法
- 三、FFT怎么做?
- 1. 系数表示法和点值表示法
- 3.如何巧妙地进行DFT? - FFT的高明之处
- 4. 单位复根 - FFT的高明之处(二)
- 5. Inverse Fast Fourier Transform - 从点值表示法回到系数表示法
- 四、FFT的递归实现
- 五、大数乘法的实现(FFT版)
- 后话(废话)
前言
Fast Fast TLE
原本做大数乘法的时候是想偷懒的, 就百度了下大数 A * B 的代码, 无意中发现有使用FFT的做法, 于是便开始了学习 (受苦) , 本文用以记录仅在算法应用层面上我对FFT的理解和一个手搓的大数乘法模版.
需要一定的复数知识, 但不多.
笔者对FFT的理解较为粗浅, 因此在下文可能大量略过某些部分的详细证明, 请见谅!
一、FFT是什么?
快速傅里叶变换(Fast Fourier Transform), 是一种对离散傅里叶变换(Discrete Fourier Transform)的优化, 可令离散傅里叶变换的运算量大大降低, 在取样点数量较多的情况下可显著提升效率
二、FFT可以干什么?
1. 多项式乘法
实际上, FFT可以大大提升卷积1的计算效率, 而当卷积的两个函数为多项式的时候, FFT则能在多项式乘法上大显神威.
2. 大数乘法
关于乘法, 朴素的算法则是模拟我们自小学会的竖式乘法, 不难证明这样的算法的复杂度为O(n^2), 然而这样的算法不仅容易精度溢出, 效率也不够高, 应用FFT则可以使算法的复杂度降低至O(nlog_2n).
观察一个数字, 如123456, 换种角度思考, 可以将其转化为以下的式子:123456 = 1 *10^5+2*10^4+3*10^3+4*10^2+5*10^1+6*10^0, 再令x = 10, 则可以得到:
1 *x^5+2*x^4+3*x^3+4*x^2+5*x^1+6*x^0, 从这个角度思考, 大数乘法不正是x = 10的情况下的多项式乘法吗?
三、FFT怎么做?
PS:强烈建议您通过这个视频进行学习并在需要的情况下结合下文理解, 个人认为这个视频讲得相当易懂
1. 系数表示法和点值表示法
任取一个n-1阶2多项式, 将其表示为a_0+a_1x+a_2x^2+...+a_{n-1}x^{n-1}实际上我们已经得到了它的系数表示, 即 \left[\begin{array}{l}a_0&a_1&a_2&...&a_{n-1}\end{array}\right]
那么什么是它的点值表示法呢?
对一个多项式f(x)= a_0+a_1x+a_2x^2+...+a_{n-1}x^{n-1},任取不小于n个x_i带入并计算得到f(x_i)即为其点值表示法:
\left\{(x_0,f(x_0),(x_1,f(x_1), \dots,(x_{n-1},f(x_{n-1})\right\}
将其化为矩阵形式, 有
PS:从 系数表示法 得到 点值表示法 的这一步即为DFT(离散傅里叶变换)
由范德蒙德行列式易证得当x_0~ x_{n-1}互不相同时矩阵可逆, 即当所取的x_i不小于矩阵的阶加一时, 点值表示法和系数表示法一一对应.
令h(x)=f(x)g(x), 在点值表示法的基础上, 要计算h(x)的表达式, 只需要取相同的 x_i 得出 f(x_i) 和 g(x_i) 并相乘, 再从(x_i,f(x_i)f(g_i))的点值表示法转换成系数表示法即可得到h(x)的值.
那么如何从点值表示法转换成系数表示法呢? 仔细观察上面的矩阵表达式不难得出:
\left\{(x_0,f(x_0)),(x_1,f(x_1)), \dots,(x_{n-1},f(x_{n-1}))\right\}, 将其化为矩阵形式, 有
PS:从 点值表示法 得到 系数表示法 的这一步即为Inverse DFT(逆离散傅里叶变换)
3.如何巧妙地进行DFT? - FFT的高明之处
对上述的DFT过程, 一个通常的想法是在x轴上随便挑几个点代入计算, 比如说x_0 = 1, x_1 = 2 ...然而这样做的话又重新掉入了O(n^2)的窠臼之中, 我们依旧需要对n个甚至以上的点计算n次, 而要探讨FFT的做法, 让我们先着眼于两个简单的多项式:P_1=x^2, 因为这是一个偶函数, 当我们确定f(x_i)时通过偶函数的性质可以立刻确定f(-x_i) = f(x_i), 这样我们任取一个点, 立刻就可以确定其相反数的函数值了.
而对于P_2= x^3, 和P_1不同, 这是个奇函数, 因此f(-x_i) = -f(x_i).
据此, 我们不妨将一个一般的多项式(设n为偶数)分解为奇函数的部分和偶函数的部分, 再从奇函数部分提取一个x:
若令p = x^2, 则Pe(x)和Po(x)简化为以下式子:
如果此时将P_e和P_o视为新的式子, 重复上述操作则可将P_e和P_o继续降阶直到P_e和P_o的式子的阶降至0, 那么此时P_e和P_oa_0和a_1.
以多项式P(x) = a_0 + a_1x + a_2x^2 + a_3x^2为例, DFT过程需要构造4个根x_0,x_1,x_2,x_3并带入求值, 以上述方法降阶则有:
第一步:
第二步:
如此, 对P_0(x)的快速傅里叶变换过程已经呼之欲出了, 然而这里却有一个严重的问题亟待解决……
4. 单位复根 - FFT的高明之处(二)
也许你已经注意到了其中的问题, 让我们回到上述第二步, 该如何取x_i的值才能使得x_0^2与x_1^2互为相反数呢, 显然在实数域中这个问题是无法被解决的.
这就是FFT的第二个高明之处, 使用n次单位复根来解决问题.
让我们继续使用上面那个多项式P_0(x), 我们需要4个数作为x代入多项式并求值, 从而得出P_0(x)的点值表达式, 那么我们不妨使用4次单位复根(1, -1, i, -i)作为x_i:
求P_0(x_i)的值, 其中
P_0(x) = a_0+a_1x+a_2x^2+a_3x^3 ,x_i = \left[ 1,-1,i,-i \right]
P_0(1)=P_{e0}(1)+1 \cdot P_{o0}(1),P_0(-1)=P_{e0}(1)-1 \cdot P_{o0}(1);
P_0(i)=P_{e0}(-1)+i \cdot P_{o0}(-1), P_0(-i)=P_{e0}(-1)-i \cdot P_{o0}(-1).
P_{e0}(1) = P_1(1) = P_{e1}(1)+1\cdot P_{o1}(1) = a_0 + 1\cdot a_2, P_{e0}(-1) = P_1(-1) = P_{e1}(-1)-1\cdot P_{o1}(1) = a_0 - 1\cdot a_2;
P_{o0}(1) = P_1(1) = P_{e2}(1)+1\cdot P_{o2}(1) = a_1 + 1\cdot a_3, P_{o0}(-1) = P_1(-1) = P_{e2}(-1)-1\cdot P_{o2}(1) = a_1 - 1\cdot a_3.
再将值代入上式, 整个FFT过程便结束了.
当然单位复根的其他(我并不熟知)的性质(如可约引理, 等分引理, 求和引理等), 造就了其十分适合用于快速傅里叶变换中.
简单来说, 对于n次单位复根(其中n是2的正整数次幂), 他们之间两两正负配对(第k个根与第k + \frac{n}{2}个根)且平方后同样两两正负配对, 这令其十分适合用于递归当中.
当然, 这些性质在n是2的正整数次幂时才生效, 当n不是2的正整数次幂时, 可自行将多项式的次数补足, 此时该项系数为0即可.
当然由于我十分的菜, 具体的证明就此略过了, 各位可以看看我推荐的那个视频或者自行寻找资料进行证明(
5. Inverse Fast Fourier Transform - 从点值表示法回到系数表示法
这一步骤之简单你绝对无法想象, 观察上文的IDFT的实现:
对第二个矩阵进行求逆:
其中x_k = \omega_k, \omega = e^{\frac{2\pi i}{n}}, 也就是说:
不难发现, 要实现IFFT, 只需在FFT的基础上将ω取倒数, 并在最终结果乘以\frac{1}{n}即可.
PS:我觉得自己写的FFT解释很烂, 在此建议您如果 (肯定) 有看不懂的部分结合刚才推荐的视频学习
四、FFT的递归实现
据此, 我们终于可以写出FFT的代码了, 我手写的递归实现如下:
#include <bits/stdc++.h>
using namespace std;
typedef unsigned long long ull;
const double Pi = acos(-1.0); //将常数Pi的值设为arccos(-1)
vector<complex<double> > FFT(vector<complex<double> > &a, int flag) {
//第一个参数为一个多项式的系数, 以次数从小到大的顺序, 向量中每一项的实部为该项系数
//flag == 1->FFT, flag == -1->IFFT
int n = a.size();
if(n == 1) //如果当前多项式仅有常数项时直接返回多项式的值
return a;
vector<complex<double> > Pe, Po; //即原文中的Pe与Po的系数表示法
complex<double> omega(cos(2.0 * Pi / n), sin(flag * 2.0 * Pi / n)), cur(1, 0); //omega为第一个n次复根, cur为第零个n次复根即1
for (unsigned int i = 0; i < n; i++) {
if(i & 1)
Po.push_back(a[i]);
else
Pe.push_back(a[i]);
}
vector<complex<double> > ye = FFT(Pe, flag), yo = FFT(Po, flag), y(n); //递归求得ye=Pe(xi), yo=Po(xi)
for (int i = 0; i < n / 2; i++) {
y[i] = ye[i] + cur * yo[i]; //求出P(xi)
y[i + n / 2] = ye[i] - cur * yo[i]; //由单位复根的性质可知第k个根与第k + n/2个根互为相反数
cur *= omega; //cur * omega得到下一个复根
}
return y; //返回最终的系数
}
当然需要注意的是, 如果当前进行的是IFFT时, 需要将最终结果除以n, 其中n为不小于原多项式阶+1的最小2的整数次幂.
因此你需要在上述代码的基础上增加一个代码, 向原系数向量补0直到向量中元素的个数为二的整数幂为止.
五、大数乘法的实现(FFT版)
了解了FFT的实现方法, 大数乘法的实现可以说是再简单不过了(毕竟前面的鬼东西都看懂了), 这里便直接贴上源代码了,当然有一个非常需要注意的地方, 最终获取的多项式系数是有可能大于等于10的, 此时需要做进位处理!
#include <bits/stdc++.h>
#define sync ios::sync_with_stdio(false)
using namespace std;
typedef unsigned long long ull;
const double Pi = acos(-1.0); //将常数Pi的值设为arccos(-1)
vector<complex<double> > FFT(vector<complex<double> > &a, int flag) {
//第一个参数为一个多项式的系数, 以次数从小到大的顺序, 向量中每一项的实部为该项系数
//flag == 1->FFT, flag == -1->IFFT
int n = a.size();
if(n == 1) //如果当前多项式仅有常数项时直接返回多项式的值
return a;
vector<complex<double> > Pe, Po; //即原文中的Pe与Po的系数表示法
complex<double> omega(cos(2.0 * Pi / n), sin(flag * 2.0 * Pi / n)), cur(1, 0); //omega为第一个n次复根, cur为第零个n次复根即1
for (unsigned int i = 0; i < n; i++) {
if(i & 1)
Po.push_back(a[i]);
else
Pe.push_back(a[i]);
}
vector<complex<double> > ye = FFT(Pe, flag), yo = FFT(Po, flag), y(n); //递归求得ye=Pe(xi), yo=Po(xi)
for (int i = 0; i < n / 2; i++) {
y[i] = ye[i] + cur * yo[i]; //求出P(xi)
y[i + n / 2] = ye[i] - cur * yo[i]; //由单位复根的性质可知第k个根与第k + n/2个根互为相反数
cur *= omega; //cur * omega得到下一个复根
}
return y; //返回最终的系数
}
vector<complex<double> > read() { //获取系数, 注意需要从右向左获取(从0次幂的系数开始)
string num;
cin >> num;
vector<complex<double> > result;
for (int i = num.size() - 1; i >= 0; i--) {
complex<double> tmp(num[i] - '0', 0);
result.push_back(tmp);
}
return result;
}
void solve(vector<complex<double> > &a, vector<complex<double> > &b) { //多项式系数表达式的修饰
complex<double> tmp(0, 0);
int sum = a.size() + b.size();
while (a.size() < sum)
a.push_back(tmp);
while (b.size() < sum)
b.push_back(tmp);
//如果两式的阶不同, 先补齐
int temp = 1;
while (temp < a.size())
temp <<= 1;
//获取不小于n的最小2的整数次幂
while (a.size() < temp) {
a.push_back(tmp);
b.push_back(tmp);
}
//补齐
}
int main() {
sync;
vector<complex<double> > num1 = read(), num2 = read(), tmp1, tmp2, mid, ans;
solve(num1, num2);
tmp1 = FFT(num1, 1), tmp2 = FFT(num2, 1);
num1.clear();
num2.clear();
for (int i = 0; i < tmp1.size(); i++)
mid.push_back(tmp1[i] * tmp2[i]);
tmp1.clear();
tmp2.clear();
ans = FFT(mid, -1);
bool Ans = false;
int add = 0;
string final;
//进位处理
for (int i = 0; i < ans.size(); i++) {
int op = round(round(ans[i].real()) / ans.size()) + add;
add = 0;
if(op >= 10)
add = op / 10;
final += op % 10 + '0';
}
if(add > 0)
final += add % 10 + '0';
for (int i = final.size() - 1; i >= 0; i--) {
if(final[i] != '0')
Ans = true;
else if(!Ans)
continue;
cout << final[i];
}
cout << '\n';
}
后话(废话)
- 历时一个寒假! 终于把这篇万字长文(x)写完了, 多谢某csome同学的鼓励~~(催更)~~ !
- 理解FFT足足花了2天时间, 好难……
- 如果博客有错漏, 敬请指出并不吝赐教, 感谢!