単純な素因数分解アルゴリズムを実装してみる

「OpenSSLとPythonでRSA暗号の原理を知る」で書いたように、RSA暗号は公開鍵である整数modulusを二つの素数素因数分解することができれば破ることができる。 ここでは、いくつかの単純な素因数分解アルゴリズムPythonで実装し、一般的なPCで解くことができるbit数などを調べてみる。 なお、正確には素因数分解ではなく、因数をひとつ見つけるアルゴリズムについて考えるものとする。

環境

Ubuntu 14.04.3 LTS 64bit版、Intel Core i5-4200U (1.6GHz * 2 * 2)

$ uname -a
Linux vm-ubuntu64 3.19.0-25-generic #26~14.04.1-Ubuntu SMP Fri Jul 24 21:16:20 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux

$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 14.04.3 LTS
Release:        14.04
Codename:       trusty

$ grep "processor\|model name" /proc/cpuinfo
processor       : 0
model name      : Intel(R) Core(TM) i5-4200U CPU @ 1.60GHz
processor       : 1
model name      : Intel(R) Core(TM) i5-4200U CPU @ 1.60GHz
processor       : 2
model name      : Intel(R) Core(TM) i5-4200U CPU @ 1.60GHz
processor       : 3
model name      : Intel(R) Core(TM) i5-4200U CPU @ 1.60GHz

素数の生成

素数とその積の生成は、OpenSSLを用いて行うこととする。 128bitのmodulusを生成する場合は次のようになる。

$ openssl genrsa 128 | openssl rsa -noout -text
Generating RSA private key, 128 bit long modulus
.+++++++++++++++++++++++++++
.+++++++++++++++++++++++++++
e is 65537 (0x10001)
Private-Key: (128 bit)
modulus:
    00:bf:27:4e:d6:73:f6:ca:f4:f6:85:f0:b6:a0:27:
    1a:31
publicExponent: 65537 (0x10001)
privateExponent:
    76:67:8f:d3:10:e3:d7:14:d1:a8:40:83:b3:81:1b:
    ad
prime1: 16144814945699257943 (0xe00de7a77ad25e57)
prime2: 15737972014275192503 (0xda688229e3e966b7)
exponent1: 9570317772029090007 (0x84d0994ed566d8d7)
exponent2: 9046986552112602077 (0x7d8d5a560e685bdd)
coefficient: 9750135051940033389 (0x874f702bdaf8736d)

試し割り

もっとも単純なアルゴリズムであり、整数nに対してsqrt(n)以下の整数で順に割っていくというもの。 計算量はO(n1/2)である。

# trial_division.py

import sys

def isqrt(n):
    x = n
    y = (x + 1) // 2
    while y < x:
        x = y
        y = (x + n//x) // 2
    return x

def trial_division(n):
    k = isqrt(n)

    if n % 2 == 0:
        return 2
    if n % 3 == 0:
        return 3

    i = 6
    while i < k:
        if n % (i-1) == 0:
            return i-1
        if n % (i+1) == 0:
            return i+1
        i += 6

if __name__ == '__main__':
    n = long(sys.argv[1])
    p = trial_division(n)
    if p:
        print "%d = %d * %d" % (n, p, n/p)
    else:
        print "%d is prime" % n

上のコードでは、2と3の倍数となるものについては飛ばすよう若干の効率化を加えている。 また、isqrt関数は整数の範囲で平方根を求める関数である。

次の実行結果の通り、64bitの素因数分解に5分程度かかる。

$ time python trial_division.py 12814570762777948741
12814570762777948741 = 3318288047 * 3861801803

real    4m47.971s
user    4m47.296s
sys     0m0.596s

$ time python trial_division.py 18366865165381711817
18366865165381711817 is prime

real    6m15.418s
user    6m15.348s
sys     0m0.000s

Pollard-Rhoアルゴリズム + Miller-Rabin素数判定法

Pollard-Rhoアルゴリズムは、乱択アルゴリズムにより高速に因数を発見するアルゴリズムである。 整数nに対しその因数をpとしたとき、計算量はO(p1/2) <= O(n1/4)となる。

乱択アルゴリズムという性質上、与えられた数が素数だった場合、停止するまでに非常に時間がかかる。 そのため、同じく確率的アルゴリズムであるMiller-Rabin素数判定法と組み合わせ、あらかじめ素数かどうかを判定しておくことが多い。

# pollard_rho.py

import sys
from random import randint
from fractions import gcd

def miller_rabin(n, k=20):
    s, d = 0, n-1

    while d % 2 == 0:
        s += 1
        d /= 2

    for i in xrange(k):
        a = randint(2, n-1)
        x = pow(a, d, n)
        if x == 1:
            continue
        for r in xrange(s):
            if x == n-1:
                break
            x = (x*x) % n
        else:
            return False

    return True

def pollard_rho(n):
    x, y, d = 2, 2, 1

    while d == 1:
        x = (x*x + 1) % n
        y = (y*y + 1) % n
        y = (y*y + 1) % n
        d = gcd(abs(x-y), n)

    if d != n:
        return d

if __name__ == '__main__':
    n = long(sys.argv[1])
    is_prime = miller_rabin(n)
    if is_prime:
        print "%d is prime" % n
    else:
        p = pollard_rho(n)
        print "%d = %d * %d" % (n, p, n/p)

Miller-Rabin素数判定法において、素数判定を誤る確率は繰り返し回数kに対し4-kとなることが知られている。 上のコードではk = 20としている。

次の実行結果の通り、96bitの素因数分解に1分程度かかる。 なお、素数の場合についてはMiller-Rabin素数判定法により1秒未満で判定できる。

$ time python pollard_rho.py 60766145992321225002169406923
60766145992321225002169406923 = 250117558771727 * 242950340194949

real    1m12.204s
user    1m12.192s
sys     0m0.000s

$ time python pollard_rho.py 71939287897297826407363026419
71939287897297826407363026419 is prime

real    0m0.029s
user    0m0.024s
sys     0m0.004s

フェルマー

フェルマー法RSAのように素数同士の積からなる合成数において、二つの素数の差が小さい場合に有効なアルゴリズムである。 具体的には、合成数nの平方根周辺のある値をxとしたとき、(x-k)*(x+k) == nとなるkを小さいものから求める。

# fermat.py

import sys

def isqrt(n):
    x = n
    y = (x + 1) // 2
    while y < x:
        x = y
        y = (x + n//x) // 2
    return x

def is_square(n):
    if not n % 48 in (0, 1, 4, 9, 16, 25, 33, 36):
        return False

    x = isqrt(n)
    return x*x == n

def fermat(n):
    a = isqrt(n)
    b2 = a*a - n
    while not is_square(b2):
        a += 1
        b2 = a*a - n
    return a - isqrt(b2)

if __name__ == '__main__':
    n = long(sys.argv[1])
    p = fermat(n)
    if p:
        print "%d = %d * %d" % (n, p, n/p)
    else:
        print "%d is prime" % n

上のコードにおいて、is_square関数は値が平方数かどうかを判定する関数である。 平方数の判定については、平方剰余をもとに平方数となりえない値を先に判定することで効率化が図ることができ、上では法48について一度判定することで83.4%の剰余について計算を省いている。

次の実行結果の通り、64bitの素因数分解に30秒程度かかる。 素数の場合については大きな時間がかかるが、Pollard-Rhoアルゴリズムの場合と同様にMiller-Rabin素数判定法を組み合わせれば高速に判定することが可能である。

$ time python fermat.py 12814570762777948741
12814570762777948741 = 3318288047 * 3861801803

real    0m23.931s
user    0m23.924s
sys     0m0.000s

また、kが小さい場合についてはnの大きさによらず高速に素因数分解できる。 ただし、そのような素数の組が選ばれる確率は非常に小さい。

次の実行結果では、nが4096bit、kが15bitの場合について、1秒未満で素因数分解できている(参考)。

$ time python fermat.py


real    0m0.040s
user    0m0.028s
sys     0m0.012s

Common Factor Attacks

厳密には素因数分解アルゴリズムではないが、異なる二つの合成数が共通の素因数を持つ場合、合成数のbit数によらず高速に素因数を発見することができる。 具体的には、二つの合成数の最大公約数を求めるだけでよい。 最大公約数はユークリッドの互除法によりO(log n)で計算できる。

# common_factor.py

import sys
from itertools import combinations
from fractions import gcd

def common_factor(nums):
    for x, y in combinations(nums, 2):
        p = gcd(x, y)
        if p > 1:
            yield (x, y, p)

if __name__ == '__main__':
    nums = [long(line) for line in sys.stdin]
    for (x, y, p) in common_factor(nums):
        print "%d = %d * %d" % (x, p, x/p)
        print "%d = %d * %d" % (y, p, y/p)

次の実行結果の通り、共通の素因数を持つ二つの合成数において、4096bitの素因数分解が1秒未満でできている。 ただし、フェルマー法同様、そのような合成数の組が見つかる確率は非常に小さい。

$ cat nums.txt



$ time { cat nums.txt | python common_factor.py; }



real    0m0.029s
user    0m0.028s
sys     0m0.000s

関連リンク