Поговорим о факторизации

volodya · 13 авг 2004

Как всегда, тут я буду писать пару алгоритмов из Кнута. Второй том. Получисленные алгоритмы.

Я готовлюсь ко третьей части упаковщиков, но этот материал в статью не пойдет (мало чести гордится переписанными на сишные перепевы серьезнейшими алгоритмами).

Огромное спасибо Dmit, за то, что он обратил мое внимание на сие:

http://virlib.eunnet.net/books/numbers/

Relf'у спасибо за то, что он обратил на это внимание Дмита. С этой ссылки началось мое путешествие в теорию чисел.

Рассматривается раздел второго тома - 4.5 - "Разложение на простые множители".

Алгоритм А.

Метод последовательного деления на все простые числа поочередно. Таблица простых чисел генерируется при помощи хитрого решета Эратосфена. Алгоритм немного подкручен - не рассматриваются все четные числа, т.к. все они являются составными. Память тоже отводится по-умному (сам себя не похвалишь, кто похвалит?).

Алгоритм может факторизовать числа лишь под unsigned int максимум. Т.е. не более 4294967295 - 4-х миллионов. Работает довольно быстро.

Код приводится ниже. Код на С++, но, по сути, можно считать, что на С.

Для обработки больших чисел пришлось бы реализовать арифметику бесконечной точности (раздел 4.3 того же тома).

Код (Text):

#include <iostream>

#include <math.h>

using namespace std;

inline static unsigned pi(unsigned x)

{

return unsigned (x / (log((double)x)-1.08366));

}

/**

* Input: M - the number we are creating a sieve up to.

* Output: allocated array of int's (EOF of the array is 0)

*

* Description is here:

* [url=http://mathworld.wolfram.com/SieveofEratosthenes.html

]http://mathworld.wolfram.com/SieveofEratosthenes.html

[/url]

* The main idea is to process the odd numbers only.

* Created using the following algo:

* [url=http://okmij.org/ftp/Scheme/Eratosthenes-sieve.txt

]http://okmij.org/ftp/Scheme/Eratosthenes-sieve.txt

[/url]

* for efficiency #t and #f are swapped

* For memory saving purposes we roughly try to calculate the

* number of the primes in the given range - pi function.

**

*/

static unsigned *Eratosthenes_sieve(unsigned M)

{

char *v = 0; // auxiliary array for storing #t or #f

v = new char[M+1];

unsigned i = 0; // i - index for "v" array, 0 <= i <= M

unsigned *primes = 0; // we collect prime numbers here, the EOF marker is 0

primes = new unsigned[pi(M)+1];

primes[0] = 2;

unsigned k = 1; // k - index for "primes" array, 0 <= k <= M

unsigned p = 0; // will hold the odd numbers

unsigned j = 0; // auxiliary variable to get rid of the multiples

do

{

v[i] = 0;

v[i+1] = 0;

i += 2;

}while(i < M);

i = 0;

do

{

p = 2*i + 3;

if (p > M) break;

if (!v[p]) // p is the prime indeed

{

//cout << p << endl;

primes[k] = p;

k++;

// now we remove all the odd multiples

for(j = 1; j <= M; j++)

{

unsigned tmp = (2*j + 1)*(2*i + 3);

if (tmp <= M)

(v[tmp] = 1);

else

break;

}

}

i++;

}while(i < M);

primes[k] = 0;

delete v;

return primes;

}

/**

* Simple factoring algorithm.

* Donald Knuth. Algorithm 4.5.4A.

**

*/

void fact_A(unsigned N)

{

//t and p are NOT used, we are just printing out the results

unsigned k = 0, n = N;

unsigned *d = Eratosthenes_sieve((unsigned)ceil(sqrt((double)N+1)));

do

{

unsigned q = n/d[k];

unsigned r = n%d[k];

if(r)

{

if(q > d[k])

{

k++;

continue;

}

else

{

cout << n << endl;

break;

}

}

else

{

cout << d[k] << endl;

n = q;

}

} while(n != 1);

delete d;

}

void main()

{

fact_A(4294967293);

}

volodya · 14 авг 2004

Есть еще такая любопытная функция - функция Эйлера. Подробнее функция описана все по той же ссылке:

"§ 3. Важнейшие функции в теории чисел", раздел "Пункт 14. Примеры мультипликативных функций.", "Пример 4. Функция Эйлера.".

Для вычисления этой функции требуется факторизовать число (читай - привести в каноническую форму). Алгоритм fact_A вполне справляется с этой задачей. Сама функция реализуется достаточно просто (только я категорически не согласен с тем, что написано тут:

http://algolist.manual.ru/maths/count_fast/phi_n.php).

Ребята предлагают считать степени, а степени считать для вычислений - это порнография в данном случае, т.к. есть другая формула, приведенная в уже упомянутой книжке.

Прошу прощения за использование С++ - в этот раз действительно используется С++ и STL, т.к. мне было лениво писать собственную реализацию для того, чтобы получить уникальные значения простых чисел (если непонятно, то разложите число 50 на простые множители - это будет 5*5*2 - так вот, функция Эйлера требует только 5 и 2, т.е. вторая пятерка должна быть исключена).

Поэтому имеем:

Код (Text):

double Euler_totient(unsigned x)

{

vector <unsigned> factored;

fact_A(x, factored);

vector <unsigned>::iterator new_end = unique(factored.begin(), factored.end());

factored.erase(new_end, factored.end());

double n = x;

for(vector <unsigned>::iterator i = factored.begin(); i != factored.end(); i++)

{

n *= (1 - 1.0/(*i));

}

return n;

}

Например, для 1000 такая функция даст 400. Это означает, что есть 400 простых чисел в интервале от 0 до 1000.

Также fact_A-алгоритм немного модифицирован. Теперь он принимает ссылку на вектор.

Skif · 14 авг 2004

Например, для 1000 такая функция даст 400. Это означает, что есть 400 простых чисел в интервале от 0 до 1000.
Нажмите, чтобы раскрыть...

volodya, Вы немного не правы. Ф-ция Эйлера возвращает количество натуральных чисел, меньших ее аргумента и взаимно простых с ним. Действительно, EulerPhi[1000] == 400. Но количество простых чисел в интервале [1, 1000] равно pi(1000) == 168.

P.S. Спасибо за приведенную ссылку.

P.P.S. Очень рекомендую пакет Mathematica - IMHO весьма полезный для реверсинга инструмент

volodya · 14 авг 2004

volodya, Вы немного не правы.

Ох, да Спасибо, что поправил!

"Функция Эйлера phi( a ) есть количество чисел из ряда 0, 1, 2,..., a - 1, взаимно простых с a ."

Да, Mathematica, штука, конечно, хорошая, но мне нравится Maple

sensy · 15 авг 2004

[offtop]

volodya

Maple? Честно говоря, я боюсь её использовать. В ней стоолько багов, причём таких откровенных, что зачастую приходится пересчитывать в других пакетах…

volodya · 17 авг 2004

Ладно, продолжаем. Сегодня у нас в гостях метод Полларда (Pollard Rho method).

Линки на теоретический ликбез:

http://algolist.manual.ru/maths/teornum/factor/p-1.php

http://mathworld.wolfram.com/PollardRhoFactorizationMethod.html

На

http://algolist.manual.ru/maths/teornum/factor/

есть линк на "A Survey of Modern Integer Factorization Methods" - подберите.

Линки на понажимать кнопочки:

http://linguistlist.org/~zheng/courseware/pollard.html

http://www.louisville.edu/~dawill03/crypto/PollardRho.html

Для Поллардовского метода нам понадобятся некоторые дополнительные функции.

1) gcd - алгоритм Евклида:

http://www.wasm.ru/forum/index.php?action=vthread&forum=17&topic=6839

2) вероятностный тест Миллера-Рабина на простоту числа - взят из Кнута и дополнительно требует:

2.1) быстрое возведение в степень

2.2) представление числа в форме n - 1 = 2<sup>k</sup>q:

http://www.wasm.ru/forum/index.php?action=vthread&forum=17&topic=6841

Теперь мы готовы. Код:

Код (Text):

static unsigned powmod(unsigned a, unsigned k, unsigned n)

{

unsigned b=1;

while (k)

{

if (!(k%2))

{

k /= 2;

a = (a*a)%n;

}

else

{

k--;

b = (b*a)%n;

}

}

return b;

}

/* Donald Knuth, vol 2., algorithm 4.5.4P - probability test for prime*/

static bool isprime(unsigned n)

{

srand(time(0));

unsigned x = rand() % (n - 1);

unsigned k, q;

do_N(n, k, q);

unsigned j = 0;

unsigned y = powmod(x, q, n);

while(j < k)

{

if(((!j) && (y == 1)) || (y == n - 1))

return true;

if((j > 0) && (y == 1))

return false;

j++;

y = (y*y)%n;

}

return false;

}

static unsigned pollard_rho(unsigned n)

{

if(isprime(n))

return 0;

unsigned factor = 1, x = 5, y = 2;

while(gcd(x-y, n) == 1)

{

x = (x*x + 1)%n;

x = (x*x + 1)%n;

y = (y*y + 1)%n;

}

factor = gcd(x-y, n);

if(factor < n)

return factor;

return 0;

}

void main()

{

cout << pollard_rho(561);

}

volodya · 17 авг 2004

Еще хорошая ссылочка:

http://www.frenchfries.net/paul/factoring/theory/index.html

volodya · 18 авг 2004

Метод разложения на множители Ферма лучше всего описан тут:

http://www.wasm.ru/forum/index.php?action=vthread&forum=18&topic=6661

Эту книгу стоит купить. В виде алгоритма, что предлагает Кнут, это может выглядеть так:

Код (Text):

#include <iostream>

#include <math.h>

using namespace std;

/* 4.5.4C */

void fermat(unsigned n)

{

double x = 2*floor(sqrt((double)n)) + 1;

unsigned y = 1;

double r = pow((floor(sqrt((double)n))), 2) - n;

for(;;)

{

if(!r)

{

cout << (x-y)/2 << endl;

return;

}

r += x;

x += 2;

do

{

r -= y;

y += 2;

}while(r > 0);

}

}

void main()

{

fermat(377);

}

volodya · 20 авг 2004

В этом разделе ранее был приведен популярный вероятностный тест Рабина-Миллера на простоту числа (был взят из Кнута). Не так давно тройка веселых индусов открыла куда более крутой детерминистический тест. Тест очень быстр. Хм. Но и не слишком-то прост

Реализацию теста можно, например, найти в Miracl.

Сама статья находится по адресу:

http://www.cse.iitk.ac.in/news/primality.html.

Чтобы написать этот алгоритм на С/С++ самому, вам потребуется большинство из процедур, приведенных в этом топике выше, а также процедура проверки числа на степень. Процедуру можно найти тут:

http://www.wasm.ru/forum/index.php?action=vthread&forum=17&topic=6888

Loger · 21 авг 2004

http://www.cse.iitk.ac.in/news/primality.html Error 404

valterg · 21 авг 2004

Loger

http://www.cse.iitk.ac.in/news/primality.html Error 404
Нажмите, чтобы раскрыть...

Как ни странно, после поиска в Гугле и закачки

старого варианта алгоритма

http://www.cse.iitk.ac.in/primality.pdf

страничка опять появилась. У них там все через базу данных организовано - видимо свой кеш почистили....

Gray · 1 ноя 2004

В ссылке от volodya лишняя точка (после html), посему у Loger и Error 404 появлялось )

maxdiver · 22 апр 2007

Код (Text):

static unsigned pollard_rho(unsigned n)

{

...

return 0;

...

}

Ноль возвращается, когда алгоритм не смог найти делителя (возможно, число простое). Не подскажете, что делать в таких случаях? Или, может быть, есть более продвинутые алгоритмы (мне нужно порядка корня - корня 4-й степени из N).

volodya · 22 апр 2007

Перед факторизацией надо прогонять через тест на простоту.

Stiver · 22 апр 2007

maxdiver

Ноль возвращается, когда алгоритм не смог найти делителя (возможно, число простое). Не подскажете, что делать в таких случаях?
Нажмите, чтобы раскрыть...

Попробовать с другими параметрами и/или другим начальным значением. На простоту число всегда нужно проверять предварительно и пытаться разложить, только если известно, что оно составное.

Или, может быть, есть более продвинутые алгоритмы (мне нужно порядка корня - корня 4-й степени из N)
Нажмите, чтобы раскрыть...

Есть, но они значительно сложнее в реализации. Правда и скорость больше. Смотри различные варианты quadratic sieve(стандарт для не очень больших чисел) и number field sieve.

UbIvItS · 22 апр 2007

Если, кто читал последнюю версию моего мана http://xproject-all.narod.ru/factorize_numbers_rus_descrip_ver6.pdf там мной была допущена ошибка в рассуждениях по MOD CATCHER.
а, вообще, замечу, что официально известные алгосы факторизации смехотворны для нумберов на 1024 и более бит.

UbIvItS · 22 апр 2007

Maple? Честно говоря, я боюсь её использовать. В ней стоолько багов, причём таких откровенных, что зачастую приходится пересчитывать в других пакетах…
Нажмите, чтобы раскрыть...

да, ну maple кульная штука, а вот mathematica имеет забавную особенность сильно грузить проц при простое)

CreatorCray · 22 апр 2007

Ну раз уж подняли тему...
Ссылки передохли, но вот то, шо надо:
Алгоритм называется AKS. Он далеко не самый быстрый, да и сами авторы утверждают: "Certain algorithms need to generate prime numbers in order to construct cryptographic keys, but algorithms to accomplish this which can be executed very efficiently already existed ... These algorithms that are commonly used in practice are actually faster than the ones [AKS] proposed"
тут:
http://web.archive.org/web/20060528185603/http://crypto.cs.mcgill.ca/~stiglic/PRIMES_P_FAQ.html

Stiver · 22 апр 2007

CreatorCray

Алгоритм называется AKS.
Нажмите, чтобы раскрыть...

Желательно пользоваться поиском, AKS как раз недавно обсуждали.

http://www.wasm.ru/forum/viewtopic.php?pid=155502#p155502
http://www.wasm.ru/forum/viewtopic.php?pid=155593#p155593

maxdiver · 22 апр 2007

Попробовать с другими параметрами и/или другим начальным значением.
Нажмите, чтобы раскрыть...

Я попытался сделать так: рандомная функция это f(x)=x*x+C (mod) N. И если произошла неудача, то увеличиваем C на единицу. Но это же очень коряво и всё равно тормознуто. Ведь мы так можем перебирать значения C прямо до корня из N, т.е. до бесконечности.
Возможно, нужно улучшить метод. Скажем, на algolist'е предлагается навороченный метод p-1 из двух шагов. Правда, я не смог его реализовать

На простоту число всегда нужно проверять предварительно и пытаться разложить, только если известно, что оно составное.
Нажмите, чтобы раскрыть...

А какие быстрые методы проверки на простоту? Я имею в виду не вероятностные, как isprime() в посте выше, а четкие тесты на простоту (в Wikipedia нашёл какие-то, но проблемы с реализацией).

Войти или зарегистрироваться

Поговорим о факторизации

volodya wasm.ru

volodya wasm.ru

Skif New Member

volodya wasm.ru

sensy New Member

volodya wasm.ru

volodya wasm.ru

volodya wasm.ru

volodya wasm.ru

Loger New Member

valterg Active Member

Gray New Member

maxdiver Max

volodya wasm.ru

Stiver Партизан дзена

UbIvItS Well-Known Member

UbIvItS Well-Known Member

CreatorCray Member

Stiver Партизан дзена

maxdiver Max

Войти или зарегистрироваться

Поговорим о факторизации

volodya wasm.ru

volodya wasm.ru

Skif New Member

volodya wasm.ru

sensy New Member

volodya wasm.ru

volodya wasm.ru

volodya wasm.ru

volodya wasm.ru

Loger New Member

valterg Active Member

Gray New Member

maxdiver Max

volodya wasm.ru

Stiver Партизан дзена

UbIvItS Well-Known Member

UbIvItS Well-Known Member

CreatorCray Member

Stiver Партизан дзена

maxdiver Max

Быстрый поиск