перемножение полиномов

persicum · 1 фев 2008

Требуется быстро перемножать 32-разрядные двоичные полиномы.
Они перемножаются как обычные двоичные числа в столбик, только вместо сложения там XOR. Блин, держу в руках кремень PIV 3000,
а чем он лучше проца Z80 из раздолбанного АОНа? Такой же кусок окаменелого дерьма, умножать НЕ УМЕЕТ!!! =(((

А че спрашиваю, нет ли там у процов семейства Intel каких-нить недокументированных возможностей или префиксов перед обычными командами беззнакового умножения, чтобы полиномы умножать?

Proteus · 1 фев 2008

del

persicum · 2 фев 2008

Я в школьные годы на Z80 - 32 битные числа умножал. Не обламывало....
Нажмите, чтобы раскрыть...

А чем это лучше, чем крутить ручку арифмометра?
По сравнению с Z80 есть такое преимущество, что таблицу умножения для 8-битных полиномов можно хранить в памяти на 128 кило и извлекать за одну ссылку по памяти. Но хочется что-то посерьезнее изобразить на 32-разрядном компе. Перемножить не проблема, проблема бысто перемножить, со временем, сравнимым со встроенным умножением обычных чисел. А иначе смысла нет, тормозить будет.

t00x · 2 фев 2008

Но хочется что-то посерьезнее изобразить на 32-разрядном компе. Перемножить не проблема, проблема бысто перемножить, со временем, сравнимым со встроенным умножением обычных чисел. А иначе смысла нет, тормозить будет.
Нажмите, чтобы раскрыть...

скорость "умножения обычных чисел" http://wasm.ru/forum/viewtopic.php?id=21543.

Ruptor · 3 фев 2008

persicum тебе надо перемножение полиномов или их перемножение по модулю как в CRC? В принципе это достаточно легко ускорить через таблицу умножения из 256 или 65536 элементов. По скорости это будет сравнимо с арифметическим умножением - всего 4-8 поисков по таблице в сache. По-другому - никак. Это редкая операция, поэтому её нет ни в одном процессоре.

asmlamo · 3 фев 2008

А чем это лучше, чем крутить ручку арифмометра?
Нажмите, чтобы раскрыть...

Тем что для достижения подобной скорости ручку нужно крутить со сверхзвуковой скоростью

asmlamo · 3 фев 2008

А че спрашиваю, нет ли там у процов семейства Intel каких-нить недокументированных возможностей или префиксов перед обычными командами беззнакового умножения, чтобы полиномы умножать?
Нажмите, чтобы раскрыть...

Может я не прав но возможно имеет смысл смотреть в сторону MMX, SSE2, SSE3 ...

К примеру есть такая замечательная команда:

XORPS xmm, xmm/m

XORит за раз число длинной в 128 бит

persicum · 3 фев 2008

тебе надо перемножение полиномов или их перемножение по модулю как в CRC? В принципе это достаточно легко ускорить через таблицу умножения из 256 или 65536 элементов.
Нажмите, чтобы раскрыть...

В принципе нужно перемножать по модулю, но не столь важно, главное как быстрее, модуль можно будет потом взять от результата скалярного произведения векторов полиномов. Вот сижу, думаю, и в упор не вижу, как CRC-шные таблицы могут тут помочь. Это что - остатки от чисел вида XX00000000. Вот прикидываю - двоичное умножение требует 32 оборота, умножение байтами в столбик требует целых 16 оборотов.
А вот 16-битные полиномы можно перемножать за одну или три ссылки по памяти через дискретные логарифмы. Берем логарифмы, складываем, берем антилогарифм суммы, и все, как на логарифмической линейке. Но для 32-битных такая таблица логарифмов будет весить 4Гига*4байта.

Это редкая операция, поэтому её нет ни в одном процессоре.
Нажмите, чтобы раскрыть...

А зря! Что стоило заменить сложение на XOR в обычном умножении? Это далось бы разработчикам абсолютно даром, и совершенно не понятно, почему такой простой фичи нигде нет в железе.

halyavin · 3 фев 2008

Потому что 99.9999% программ не перемножают полиномы (и уж тем более в критических по времени частях), но перемножают числа.

persicum · 3 фев 2008

Потому что 99.9999% программ не перемножают полиномы (и уж тем более в критических по времени частях), но перемножают числа.
Нажмите, чтобы раскрыть...

Для криптографии, помехоустойчивых кодов и генераторов случайных чисел пригодилось бы...

Clerk · 3 фев 2008

Кстати z80 выполнял вычисление тригонометрии с помощью разложения функции в ряд Тейлора

persicum · 4 фев 2008

Кстати z80 выполнял вычисление тригонометрии с помощью разложения функции в ряд Тейлора
Нажмите, чтобы раскрыть...

Да не гони! Там были многочлены Чебышева, у них экстремально-хорошие свойства, а не просто сходимость, как у Тейлора.

Clerk · 4 фев 2008

Да не гони!
Нажмите, чтобы раскрыть...

В математике я не силён, но Calculator спектрум вычислял SIN(x) именно так.

RElf · 15 фев 2008

Читайте главу 38 в Algorithms for programmers.

RElf · 15 фев 2008

И здесь тоже можно отослать к книжке "Алгебраические и алгоритмические основы: Элементарное введение в эллиптическую криптографию":

4 Арифметика GF(2^n) в полиномиальном базисе
4.1. Особенности реализации операций
4.1.1. Выбор поля и способов реализации
4.2. Классический алгоритм умножения в GF(2)[X]
4.2.1. Элементарные многочлены. Таблица умножения
4.2.2. Умножение многочленов с использованием таблицы умножения
4.2.3. Модификация классического алгоритма и гибридный алгоритм умножения
4.2.4. Еще две модификации классического алгоритма умножения
4.3. Алгоритм Карацубы и его реализация
4.3.1. О методе Карацубы
4.3.2. Умножение многочленов по методу Карацубы
4.3.3. Декомпозиционная схема умножения многочленов над GF(2)
4.3.4. Умножение многочленов
и т.д.
Нажмите, чтобы раскрыть...

profile003 · 15 фев 2008

И здесь тоже можно отослать к книжке "Алгебраические и алгоритмические основы: Элементарное введение в эллиптическую криптографию":4 Арифметика GF(2^n) в полиномиальном базисе 4.1. Особенности реализации операций 4.1.1. Выбор поля и способов реализации 4.2. Классический алгоритм умножения в GF(2)[X] 4.2.1. Элементарные многочлены. Таблица умножения 4.2.2. Умножение многочленов с использованием таблицы умножения 4.2.3. Модификация классического алгоритма и гибридный алгоритм умножения 4.2.4. Еще две модификации классического алгоритма умножения 4.3. Алгоритм Карацубы и его реализация 4.3.1. О методе Карацубы 4.3.2. Умножение многочленов по методу Карацубы 4.3.3. Декомпозиционная схема умножения многочленов над GF(2) 4.3.4. Умножение многочленови т.д.
Нажмите, чтобы раскрыть...

Удивительно, но я как раз читаю именно эту книжку и эту главу!
В принципе, как я понял, умножение многочленов по мет.Карацубы реализовать не просто (если не использовать готовые исходники), а вот написать собственный модифицированный классический алгоритм перемножения с помощью таблиц - вполне реально, особенно если это кольцо GF(2)[X]

maxdiver · 16 фев 2008

profile003
Может, я чего-то не понимаю, но алгоритм Карацубы весьма прост.
Вот как я его реализовывал (конечно, догадываюсь, что это не самая лучшая реализация... )

Код (Text):

void xmultiply_karatsuba (const lnum & right, lnum & result) const

{

size_t l = std::max (length(), right.length()) / 2;

lnum

a1 = *this >> l,

b1 = right >> l,

a2 = this->last_digits (l),

b2 = right.last_digits (l),

r1 = a1 * b1,

r2 = (a1 - a2) * (b2 - b1),

r3 = a2 * b2;

result = (r1 << 2*l) + (r1 << l) + (r2 << l) + (r3 << l) + r3;

}

где operator* сводится к функции:

Код (Text):

void xmultiply (const lnum & right, lnum & result) const

{

if (std::max (length(), right.length()) > 100)

xmultiply_karatsuba (right, result);

else

xmultiply_comba (right, result);

}

profile003 · 16 фев 2008

Может, я чего-то не понимаю, но алгоритм Карацубы весьма прост.Вот как я его реализовывал (конечно, догадываюсь, что это не самая лучшая реализация... )
Нажмите, чтобы раскрыть...

Вообщем это решение "в лоб" идеи алгоритма умножения, а в книжке написано про эффективное перемножение, которое сводится к декомпозиции перемножаемых полиномов в элементарные полиномы и рекурсивное применение алгоритма Карацубы .... но я пока это еще читаю

maxdiver · 17 фев 2008

Какой же это "умножение в лоб", если тут оба полинома делятся пополам, получившиеся 4 части перемножаются между собой рекурсивно, и всё объединяется?

profile003 · 17 фев 2008

Какой же это "умножение в лоб", если тут оба полинома делятся пополам
Нажмите, чтобы раскрыть...

это базовая схема умножения алгоритмом Карацубы

декомпозиции перемножаемых полиномов в элементарные полиномы
Нажмите, чтобы раскрыть...

позволяет распараллелить алгоритм на несколько процессоров

Войти или зарегистрироваться

перемножение полиномов

persicum New Member

Proteus Member

persicum New Member

t00x New Member

Ruptor Marcos el Ruptor

asmlamo Well-Known Member

asmlamo Well-Known Member

persicum New Member

halyavin New Member

persicum New Member

Clerk Забанен

persicum New Member

Clerk Забанен

RElf New Member

RElf New Member

profile003 New Member

maxdiver Max

profile003 New Member

maxdiver Max

profile003 New Member

Войти или зарегистрироваться

перемножение полиномов

persicum New Member

Proteus Member

persicum New Member

t00x New Member

Ruptor Marcos el Ruptor

asmlamo Well-Known Member

asmlamo Well-Known Member

persicum New Member

halyavin New Member

persicum New Member

Clerk Забанен

persicum New Member

Clerk Забанен

RElf New Member

RElf New Member

profile003 New Member

maxdiver Max

profile003 New Member

maxdiver Max

profile003 New Member

Быстрый поиск