跳到主要内容

快速幂与矩阵快速幂

什么是快速幂,为什么要使用快速幂?

Macw: 快速幂有好多好处。 Penelope: 例如? Macw: 它比较快。

见名知意,快速幂算法可以在非常短的时间内求出一个数的 nn 次幂。虽然快速幂在初学阶段的应用不算太多,但是快速幂背后的思想是非常值得我们去理解的。

举例而言,如果我们要求出 343^4 的值是多少?我们当然可以暴力求解 3×3×3×3=813 \times 3 \times 3 \times 3 = 81。如果要求出 3n3^{n} 是多少呢?暴力也还不为过...

暴算法力求解一个数的次幂的时间复杂度是 O(n)O(n)。如果我们要求解的次幂非常高的时候,那么速度就会变得非常慢。众所周知,普通64位测评机每秒也就能处理 10810^8 左右的数据。因此我们需要找到一个更优的算法来解决这个问题。

快速幂算法的核心思想就是幂运算的乘法法则。

我们以求 3163^{16} 为例,根据“同底次幂相乘,底数不变,指数相加的法则”,我们可以把问题看作成求解 38×383^{8} \times 3^{8} 的值。不难看出,这样的话我们只需要知道 383^8 的值,我们就可以快速求出 3163^{16} 的值了,不再需要在 383^8 的基础上再乘 88 遍来得到最终结果。相同地,我们也可以以同样的方法快速求出 383^8 的值,这样子程序运行的速度将会大大减少:

再以计算 3163^{16} 次方为例:

  1. 我们先计算 323^2 的值。
  2. 然后就可以立刻计算出 343^4 的值。
  3. 然后就又可以计算出 383^8 的值。
  4. 最后就能快速地计算出 3163^{16} 的值了。

比较新的快速幂的算法和普通的暴力算法,可以看到原本需要运行 1616 次的乘法运算现在只需要运算 44 次就可以计算出答案了。当数据量越大的时候,两个算法的速度差距就会越明显。(稍微学过初高等数学的人可以推断出快速幂算法的时间复杂度约为 O(log2(n))O(log_2(n)),对数时间复杂度远优于线性时间复杂度)。

快速幂算法的进一步拓展

然而,大家也都发现了,普通的快速幂算法只能解决要求解次幂为 22 的指数的情况(将代码稍做修改其实也可以解决所有以偶数作为次幂的情况)(例如:1,2,4,8,,2n1, 2, 4, 8, \dots, 2^n)。难道对于那些非 22 的指数倍的次幂就没有办法了吗?当然不是。

我们都知道,任意一个数字都可以被查分成多个 22 的次幂的和。

例如数字 3434,可以写成二进制形式 100100(Base 2)100100_{(Base\space2)}。那么 3232 这个数字就可以被分解成 25+222^5 + 2^2。再根据幂运算的乘法法则,若要计算出任意数字 x34x^{34},只需要计算出 x25x^{2^5}x22x^{2^2},即 x32x^{32}x4x^{4} 就可以再按照之前的快速幂方法快速求解答案。

因此,对于求任意一个指数非 22 的次幂的值,我们可以将这个指数分解成多个 22 的次幂相加的和并依次求解出最后的答案即可。其中,这多个 22 的次幂的数字我们也可以通过普通的快速幂算法快速求得答案。

到目前为止,快速幂算法就迎刃而解了。

快速幂算法的代码以及实现

这个是 C++ 代码的快速幂模版:

这段代码通过递归求解问题,将一个大的次幂转变成两个小的次幂的积进行运算。

// 计算以 base 为底数的 exponent 次方的值
long long quick_power_recursive(int base, int exponent) {
if (exponent == 0)
// 如果指数为0,返回1
return 1;
else if (exponent % 2 == 0) {
// 如果指数为偶数,递归计算底数的一半指数幂
long long temp = quick_power_recursive(base, exponent / 2);
// 返回底数的一半指数幂的平方
return temp * temp;
} else {
// 如果指数为奇数,递归计算底数的一半指数幂
long long temp = quick_power_recursive(base, (exponent - 1) / 2);
// 返回底数乘以底数的一半指数幂的平方
return base * temp * temp;
}
}

这个是经过位运算优化过后的快速幂模板:

// 计算以 base 为底数的 exponent 次方的值
long long quick_power(int base, int exponent) {
// 初始化结果为 1
long long result = 1;
// 当指数不为0时进行循环
while (exponent) {
// 如果指数为奇数,将当前底数乘到结果中
if (exponent & 1)
result *= base;
// 底数平方
base *= base;
// 将指数右移一位,相当于除以 2
exponent >>= 1;
}
return result; // 返回结果
}

矩阵快速幂 - 结束语

学过线性代数的同学们看过来!

快速幂算法不光可以求解普通的快速幂问题,我们还可以用同样的方法对一个任意大小的矩阵求快速幂。快速幂在矩阵乘法中的作用非常的大,普通的两个矩阵相乘的时间复杂度约为 O(n3)O(n^3),其中 n×nn \times n 为矩阵的大小。

Matrix=[a1,1a1,2a1,3a2,1a2,2a2,3a3,1a3,2a3,3]nMatrix = \begin{bmatrix} a_{1,1} & a_{1,2} & a_{1,3} \\ a_{2,1} & a_{2,2} & a_{2,3} \\ a_{3,1} & a_{3,2} & a_{3,3} \end{bmatrix}^n

相比较普通快速幂,矩阵快速幂只需要重新定义乘法的运算规则即可。这里提供一个用结构体来重定义运算符的方法:

struct matrix{
int a[5][5];
matrix() { memset(a, 0, sizeof a); }
matrix operator * (const matrix &b) const {
matrix res;
for (int i=1; i<=2; i++){
for (int j=1; j<=2; j++){
for (int k=1; k<=2; k++){
res.a[i][j] = (res.a[i][j] + a[i][k] * b.a[k][j]) % MOD;
}
}
}
return res;
}
} ans, base;

矩阵快速幂的一个常见应用场景就是动态规划,也就是我们常说的矩阵加速动态规划算法。有关这方面的知识我会在后期单独出一篇文章来详细讲解。