数论篇1——素数问题

佚名 6年前 (2019-10-15) 算法 2372人围观抢沙发百度已收录

素数的判定

试除法

（1）普通

复杂度：$O(n)$

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

bool prime(int x){//判断x是不是质数，是返回true，不是返回false 
    if(x <= 1) return false; 
    for(int i = 2; i < x; i ++){
        if(x % i == 0) return false;
    }
    return true;
}

（2）改进

复杂度：$O(\sqrt{n})$

bool prime(int x){
    if(x <= 1) return false; 
    for(int i = 2; i <= sqrt(x); i ++){
        if(x % i == 0) return false;
    }
    return true;
}
//用乘法可以避免根号的误差
bool prime(int x){
    if(x <= 1) return false; 
    for(int i = 2; i * i <= x; i ++){
        if(x % i == 0) return false;
    }
    return true;
}

根据题目不同，有可能你需要先预处理出 $1\sim N$这$N$个数是否是素数，就是俗称的打表，再用上面的这些方法，复杂度就是$O(\sqrt{n})$，如果$N$特别大，就比较慢了。

埃式筛

原理：质数的倍数都不是质数

比如$2$是质数，那么$4,6,8,10,12...$都不是质数

然后看$3$是质数，那么$6,9,12,15,18,21...$都不是质数

然后看$4$，$4$已经被$2$标记为合数了，所以跳过

然后看$5$这样一直循环下去。

时间复杂度：$O(nloglogn)$

const int N = 100000 + 5;
bool P[N];
int total,prime[N];//就往大了开，反正不用的不算内存

void AiSieve() {
    for (int i = 2; i < N; i++) {
        if (!P[i]) {
            prime[total++] = i;
            for (int j = i * 2; j < N; j += i) {
                P[j] = true;
            }
        }
    }
}

线性素数筛选（欧拉筛）

在埃氏筛法的思想上，这个方法可以保证每个合数都被它最小的质因数筛去，所以一个数只会经过一次。

比如$12$，既是$2$的倍数，也是$3$的倍数，在埃氏筛中，会被$2$和$3$筛选两次，而在欧拉筛中$12$只会被$6*2$筛选，而不会被$4*3$筛选。

时间复杂度为$O(n)$，其实对于埃氏筛，$loglogn$非常小，我们能碰到的问题级别，区别其实不太大（loglog(10^10) ≈ 5.2），把埃筛看成线性也无妨，毕竟好写。很大，差了好几倍。

核心思想：

红色标注的地方是整个算法的灵魂，保证每个合数被它最小的质因数筛去。

$i\ \%\ prime[j]==0$，就是如果出现 $prime[j]\ |\ i$，
那么一定有

$prime[j]\ |\ i*prime[j+1]，prime[j]\ |\ i*prime[j+2]\ ...\ prime[j]\ |\ i*prime[tot-1]$

举个例子，对着上面的来，i = 6时，（此时小于$6$的质数都被装进prime里）

$6\ \%\ 2==0$，说明$2\ |\ 6$

那么一定有

$2\ |\ 6*3$，$2\ |\ 6*5$

也就是说$18$和$30$都有最小质因数$2$，$18=9*2,\ 30=15*2$，所以跳出循环，保证每个合数被它最小的质因数筛去。

const int N = 100000 + 5;
bool M[N];//prime[i]表示i是不是质数 
int prime[N], tot;//p[N]用来存质数 
void EulerSieve() {
    for (int i = 2; i < N; i++) {
        M[i] = true;
    }
    for (int i = 2; i < N; i++) {
        if (M[i]) prime[tot++] = i;//把质数存起来 
        for (int j = 0; j < tot && i * prime[j] < N; j++) {
            M[i * prime[j]] = false;
            if (i % prime[j] == 0) break;
        }
    }
}

拓展应用

上述算法的除去打素数表，我们可以根据算法的思想做一些别的事情。

（1）埃氏筛，获取$1\sim N$数的所有素因子

const int N = 100000 + 5;
vector<int> prime_factor[N];
void get_prime_factor() {
    for (int i = 2; i < N; i++) {
        if (prime_factor[i].size() == 0) {//如果i是质数 
            for (int j = i; j < N; j += i) {
                prime_factor[j].push_back(i);
            }
        }
    }
}

（2）埃氏筛，获取1~N数的所有素因数分解

const int N = 100000 + 5;
vector<int> prime_factor[N];
void factorization() {
    for (int i = 2; i < N; i++) {
        if (prime_factor[i].size() == 0) {//如果i是质数 
            for (int j = i; j < N; j += i) {
                int temp = j;
                while (temp >= i) {
                    if (temp % i == 0) {
                        prime_factor[j].push_back(i);
                        temp /= i;
                    }
                    else break;
                }
            }
        }
    }
}

Miller - Rabin素数测试

本段落参考：http://www.matrix67.com/blog/archives/234

费马小定理：

若$p$是质数，且$gcd(a,p) = 1$，那么$a^{p-1}mod\ p=1$

根据逆反命题的等价性，不满足$2^{(n-1)} mod\ n = 1$的$n$一定不是素数；如果满足的话则多半是素数。那么如果我只计算$2^{(n-1)} mod\ n$的值，那么素性判断出错的概率有多少？在前10亿个自然数中共有50847534个素数，而满足$2^{(n-1)} mod\ n = 1$的合数n有5597个。这样算下来，算法出错的可能性约为0.00011。这个概率太高了，我们刚才只考虑了$a=2$的情况。对于式子$a^{(n-1)} mod\ n$，取不同的a可能导致不同的结果。一个合数可能在$a=2$时通过了测试，但$a=3$时的计算结果却排除了素数的可能。于是，人们扩展了伪素数的定义，称满足$a^{(n-1)} mod\ n = 1$的合数n叫做以a为底的伪素数。前10亿个自然数中同时以2和3为底的伪素数只有1272个，这个数目不到刚才的$\frac{1}{4}$。这告诉我们如果同时验证$a=2$和$a=3$两种情况，算法出错的概率降到了0.000025。容易想到，选择用来测试的a越多，算法越准确。通常我们的做法是，随机选择若干个小于待测数的正整数作为底数a进行若干次测试，只要有一次没有通过测试就可以判定不是素数。这就是费马素性测试。

但是居然就有这样的合数，假设为n，它可以通过所有a（小于n，且满足$(gcd,n)=1$的数）的测试（这个说法不准确，详见我在地核楼层的回复）。而且第一个这样极端的伪素数小得惊人，仅仅是一个三位数，561。前10亿个自然数中这样的数有600多个。

Miller和Rabin两个人的工作让Fermat素性测试迈出了革命性的一步，建立了传说中的Miller-Rabin素性测试算法。新的测试基于下面的定理：

二次探测定理：

若$p$为质数，$x^{2}\equiv 1(mod\ )p$，则有$x\equiv (mod\ p)$或$x\equiv p-1(mod\ p)$

算法描述：

Miller-Rabin素性测试同样是不确定算法，我们把可以通过以a为底的Miller-Rabin测试的合数称作以a为底的强伪素数。第一个以2为底的强伪素数为2047。第一个以2和3为底的强伪素数则大到1 373 653。对于大数的素性判断，目前Miller-Rabin算法应用最广泛。一般底数仍然是随机选取，但当待测数不太大时，选择测试底数就有一些技巧了。比如，如果被测数小于4 759 123 141，那么只需要测试三个底数2, 7和61就足够了。当然，你测试的越多，正确的范围肯定也越大。如果你每次都用前7个素数(2, 3, 5, 7, 11, 13和17)进行测试，所有不超过341 550 071 728 320的数都是正确的。如果选用2, 3, 7, 61和24251作为底数，那么$10^16$内唯一的强伪素数为46 856 248 255 981。这样的一些结论使得Miller-Rabin算法在OI中非常实用。通常认为，Miller-Rabin素性测试的正确率可以令人接受，随机选取k个底数进行测试算法的失误率大概为$4^{-k}$。

完整代码：

#include <iostream>
#include <math.h>
#include <time.h>
using namespace std;
int prime[5] = { 2, 3, 7, 61,24251 };

long long quickPower(long long down, long long e, long long mod) {
    long long a = down, res = 1;
    while (e) {
        if (e & 1)
            res = ((res % mod) * (a % mod)) % mod;
        a = ((a % mod) * (a % mod)) % mod;
        e >>= 1;
    }
    return res;
}
bool MillerRabin(long long p) {
    if (p == 1 || p == 0)return false;
    for (int i = 0; i < 5; i++) {
        if (p == prime[i])return true;
        if (p % prime[i] == 0 || p < prime[i])return false;
        int a = i, e = p - 1;
        if (p % prime[i] == 0 || e & 1)return false;
        while (!(e & 1)) {
            int res = quickPower(a, e, p);
            if (res == 1)
                e /= 2;
            else if (res == p - 1)
                return true;
            else 
                return false;
        }
    }
    return true;
}

int main() {
    long long N;
    while (cin >> N) {
        if (MillerRabin(N)) {
            cout << "Y" << endl;
        }
        else
            cout << "N" << endl;
    }
}

素数的一些神奇性质

（1）所有大于$2$的素数都可以唯一地表示成两个平方数之差。

证明如下：

（2）麦森数

如果$2^{p}-1$是素数，其中指数$p$一定也是素数。

证明如下：

原命题的逆否命题为：如果$p$不是素数，则$2^{p}-1$不是素数。

如果p不是素数，可以假设 $p=m\cdot n$

$2^p-1=(2^m)^{n}-1=(x-1)(x^{n-1}+x^{n-2}+...+1), x=2^m$

逆否命题成立，原命题成立。

拓展：

求$2^{p}-1$的位数，$2^{p}-1$和$2^{p}$的位数是相同的，因为$2^{p}$最后一个一定不为$0$，可以直接求$2^{p}$的位数。设$k=2^{p}$，根据$10^n$的位数为$n+1$，只要想办法把$k=2^{p}$中的底数$2$转换成$10$，指数$+1$就是位数了。根据$10^{log_{10}{2}}=2$，于是$k=(10^{log_{10}{2}})^p$，把$p$乘进去就是$k=10^{p\cdot log_{10}{2}}$，所以位数就是$p\cdot log_{10}{2}+1$（cmath中自带log10()函数）

（3）当$n$为大于$2$的整数时，$2^{n}+1$和$2^{n}-1$两个数中，如果其中一个数是素数，那么另一个数一定是合数。

证明如下：

$2^n$一定不能被$3$整除

如果$ (2 ^ {n} \% 3 == 1)$，则一定有：$2 ^{ n} - 1 \% 3 == 0$；

如果 $(2 ^ {n} \% 3 == 2)$，则一定有：$2 ^{ n} + 1 \% 3 == 0$;

也就是说，$2^{n}+1$和$2^{n}-1$中至少有一个是合数。

（4）大于$3$的素数一定是$6$的倍数$ ±1 $

证明如下：

素数$±1$必然是偶数，一定可以被2整除

素数除以$3$，如果余$1$，减$1$后余$0$,；如果余$2$，加$1$后余$0$，即可以素数$±1$后被$3$整除

结合上面两行，素数$±1$，一定可以被$6$整除

扫码关注我们

微信号：SRE实战

拒绝背锅运筹帷幄

赞 0 赏分享

转载请注明 : 文章转载自小翔博客数论篇1——素数问题

本文标题：数论篇1——素数问题

本文链接：https://www.liuyixiang.com/post/105569.html

上一篇 : 安全术语介绍

下一篇 : “金益智投”荣获2019年人工智能十大科技创新奖

评论列表暂无评论

发表评论

数论篇1——素数问题

素数的判定

试除法

埃式筛

线性素数筛选（欧拉筛）

拓展应用

Miller - Rabin素数测试

费马小定理：

二次探测定理：

算法描述：

完整代码：

素数的一些神奇性质

证明如下：

证明如下：

证明如下：

证明如下：

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

« 2024年2月 »
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29

数论篇1——素数问题

素数的判定

试除法

埃式筛

线性素数筛选（欧拉筛）

拓展应用

Miller - Rabin素数测试

费马小定理：

二次探测定理：

算法描述：

完整代码：

素数的一些神奇性质

证明如下：

证明如下：

证明如下：

证明如下：

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

User Login

帐号或密码错误,请重试.