「OpenSSLとPythonでRSA暗号の原理を知る」で書いたように、RSA暗号は公開鍵である整数modulusを二つの素数に素因数分解することができれば破ることができる。 ここでは、いくつかの単純な素因数分解アルゴリズムをPythonで実装し、一般的なPCで解くことができるbit数などを調べてみる。 なお、正確には素因数分解ではなく、因数をひとつ見つけるアルゴリズムについて考えるものとする。
環境
Ubuntu 14.04.3 LTS 64bit版、Intel Core i5-4200U (1.6GHz * 2 * 2)
$ uname -a Linux vm-ubuntu64 3.19.0-25-generic #26~14.04.1-Ubuntu SMP Fri Jul 24 21:16:20 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux $ lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 14.04.3 LTS Release: 14.04 Codename: trusty $ grep "processor\|model name" /proc/cpuinfo processor : 0 model name : Intel(R) Core(TM) i5-4200U CPU @ 1.60GHz processor : 1 model name : Intel(R) Core(TM) i5-4200U CPU @ 1.60GHz processor : 2 model name : Intel(R) Core(TM) i5-4200U CPU @ 1.60GHz processor : 3 model name : Intel(R) Core(TM) i5-4200U CPU @ 1.60GHz
素数の生成
素数とその積の生成は、OpenSSLを用いて行うこととする。 128bitのmodulusを生成する場合は次のようになる。
$ openssl genrsa 128 | openssl rsa -noout -text Generating RSA private key, 128 bit long modulus .+++++++++++++++++++++++++++ .+++++++++++++++++++++++++++ e is 65537 (0x10001) Private-Key: (128 bit) modulus: 00:bf:27:4e:d6:73:f6:ca:f4:f6:85:f0:b6:a0:27: 1a:31 publicExponent: 65537 (0x10001) privateExponent: 76:67:8f:d3:10:e3:d7:14:d1:a8:40:83:b3:81:1b: ad prime1: 16144814945699257943 (0xe00de7a77ad25e57) prime2: 15737972014275192503 (0xda688229e3e966b7) exponent1: 9570317772029090007 (0x84d0994ed566d8d7) exponent2: 9046986552112602077 (0x7d8d5a560e685bdd) coefficient: 9750135051940033389 (0x874f702bdaf8736d)
試し割り
もっとも単純なアルゴリズムであり、整数nに対してsqrt(n)以下の整数で順に割っていくというもの。 計算量はO(n1/2)である。
# trial_division.py import sys def isqrt(n): x = n y = (x + 1) // 2 while y < x: x = y y = (x + n//x) // 2 return x def trial_division(n): k = isqrt(n) if n % 2 == 0: return 2 if n % 3 == 0: return 3 i = 6 while i < k: if n % (i-1) == 0: return i-1 if n % (i+1) == 0: return i+1 i += 6 if __name__ == '__main__': n = long(sys.argv[1]) p = trial_division(n) if p: print "%d = %d * %d" % (n, p, n/p) else: print "%d is prime" % n
上のコードでは、2と3の倍数となるものについては飛ばすよう若干の効率化を加えている。 また、isqrt関数は整数の範囲で平方根を求める関数である。
次の実行結果の通り、64bitの素因数分解に5分程度かかる。
$ time python trial_division.py 12814570762777948741 12814570762777948741 = 3318288047 * 3861801803 real 4m47.971s user 4m47.296s sys 0m0.596s $ time python trial_division.py 18366865165381711817 18366865165381711817 is prime real 6m15.418s user 6m15.348s sys 0m0.000s
Pollard-Rhoアルゴリズム + Miller-Rabin素数判定法
Pollard-Rhoアルゴリズムは、乱択アルゴリズムにより高速に因数を発見するアルゴリズムである。 整数nに対しその因数をpとしたとき、計算量はO(p1/2) <= O(n1/4)となる。
乱択アルゴリズムという性質上、与えられた数が素数だった場合、停止するまでに非常に時間がかかる。 そのため、同じく確率的アルゴリズムであるMiller-Rabin素数判定法と組み合わせ、あらかじめ素数かどうかを判定しておくことが多い。
# pollard_rho.py import sys from random import randint from fractions import gcd def miller_rabin(n, k=20): s, d = 0, n-1 while d % 2 == 0: s += 1 d /= 2 for i in xrange(k): a = randint(2, n-1) x = pow(a, d, n) if x == 1: continue for r in xrange(s): if x == n-1: break x = (x*x) % n else: return False return True def pollard_rho(n): x, y, d = 2, 2, 1 while d == 1: x = (x*x + 1) % n y = (y*y + 1) % n y = (y*y + 1) % n d = gcd(abs(x-y), n) if d != n: return d if __name__ == '__main__': n = long(sys.argv[1]) is_prime = miller_rabin(n) if is_prime: print "%d is prime" % n else: p = pollard_rho(n) print "%d = %d * %d" % (n, p, n/p)
Miller-Rabin素数判定法において、素数判定を誤る確率は繰り返し回数kに対し4-kとなることが知られている。
上のコードではk = 20
としている。
次の実行結果の通り、96bitの素因数分解に1分程度かかる。 なお、素数の場合についてはMiller-Rabin素数判定法により1秒未満で判定できる。
$ time python pollard_rho.py 60766145992321225002169406923 60766145992321225002169406923 = 250117558771727 * 242950340194949 real 1m12.204s user 1m12.192s sys 0m0.000s $ time python pollard_rho.py 71939287897297826407363026419 71939287897297826407363026419 is prime real 0m0.029s user 0m0.024s sys 0m0.004s
フェルマー法
フェルマー法はRSAのように素数同士の積からなる合成数において、二つの素数の差が小さい場合に有効なアルゴリズムである。
具体的には、合成数nの平方根周辺のある値をxとしたとき、(x-k)*(x+k) == n
となるkを小さいものから求める。
# fermat.py import sys def isqrt(n): x = n y = (x + 1) // 2 while y < x: x = y y = (x + n//x) // 2 return x def is_square(n): if not n % 48 in (0, 1, 4, 9, 16, 25, 33, 36): return False x = isqrt(n) return x*x == n def fermat(n): a = isqrt(n) b2 = a*a - n while not is_square(b2): a += 1 b2 = a*a - n return a - isqrt(b2) if __name__ == '__main__': n = long(sys.argv[1]) p = fermat(n) if p: print "%d = %d * %d" % (n, p, n/p) else: print "%d is prime" % n
上のコードにおいて、is_square関数は値が平方数かどうかを判定する関数である。 平方数の判定については、平方剰余をもとに平方数となりえない値を先に判定することで効率化が図ることができ、上では法48について一度判定することで83.4%の剰余について計算を省いている。
次の実行結果の通り、64bitの素因数分解に30秒程度かかる。 素数の場合については大きな時間がかかるが、Pollard-Rhoアルゴリズムの場合と同様にMiller-Rabin素数判定法を組み合わせれば高速に判定することが可能である。
$ time python fermat.py 12814570762777948741 12814570762777948741 = 3318288047 * 3861801803 real 0m23.931s user 0m23.924s sys 0m0.000s
また、kが小さい場合についてはnの大きさによらず高速に素因数分解できる。 ただし、そのような素数の組が選ばれる確率は非常に小さい。
次の実行結果では、nが4096bit、kが15bitの場合について、1秒未満で素因数分解できている(参考)。
$ time python fermat.pyreal 0m0.040s user 0m0.028s sys 0m0.012s
Common Factor Attacks
厳密には素因数分解アルゴリズムではないが、異なる二つの合成数が共通の素因数を持つ場合、合成数のbit数によらず高速に素因数を発見することができる。 具体的には、二つの合成数の最大公約数を求めるだけでよい。 最大公約数はユークリッドの互除法によりO(log n)で計算できる。
# common_factor.py import sys from itertools import combinations from fractions import gcd def common_factor(nums): for x, y in combinations(nums, 2): p = gcd(x, y) if p > 1: yield (x, y, p) if __name__ == '__main__': nums = [long(line) for line in sys.stdin] for (x, y, p) in common_factor(nums): print "%d = %d * %d" % (x, p, x/p) print "%d = %d * %d" % (y, p, y/p)
次の実行結果の通り、共通の素因数を持つ二つの合成数において、4096bitの素因数分解が1秒未満でできている。 ただし、フェルマー法同様、そのような合成数の組が見つかる確率は非常に小さい。
$ cat nums.txttime { cat nums.txt | python common_factor.py; }real 0m0.029s user 0m0.028s sys 0m0.000s