Сдвиг (длинная арифметика)

Loger · 18 авг 2004

В edx:eax лежит 64-битное беззнаковое целое. Как можно реализовать сдвиг этого числа на ecx битов? MMX/SSE не годятся, т. к. нужно контролировать переполнение

Artem · 18 авг 2004

Вправо:

shrd eax,edx,cl

shr edx,cl

Влево:

shld edx,eax,cl

shl eax,cl

Правда переполнение так не поймаешь

Loger · 18 авг 2004

Artem

У этого способа есть недостаток: при ecx>31 он работает неправильно

Artem · 18 авг 2004

Loger

Для случая ecx>31 можно так:

shr edx,cl

mov eax,edx

xor edx,edx

shl eax,cl

mov edx,eax

xor eax,eax

И для случая ecx>=64 тоже специальный вариант. Другое в голову что-то не приходит.

Chingachguk · 19 авг 2004

shl+rcl/shr+rcr ?

S_T_A_S_ · 19 авг 2004

Вариант для сдвига влево. Вправо можно сделать аналогично заменив ротации и сдвиг на противоположные, и убрать инструкции test+jnz, поскольку там переполнение видимо (?) не грозит.

Код (Text):

or ebx,-1

;mov esi, ebx

mov edi, ebx

rol edx, cl

rol eax, cl

shl ebx, cl

xor edi, ebx

;xor esi, ebx

test edi, edx; and esi, edx

jnz overflow

and edx, ebx

and edi, eax

and eax, ebx

or edx, edi

Это для случаев ecx<32, для больших, как предлагает Artem.

Если же ecx>=64, очевидно будет переполнение.

PS

Может лучше всё же через MMX, а переполнение отдельно проверить?

PSS

Вот ещё, под условия не подходит, но может пригодится 64-bit integer math

PSSS

подправил немного код, а то большой слишком был

shoo · 19 авг 2004

может, так?

влево

Код (Text):

@@:

sal eax,1

rcl edx

jc переполнение

loop @B

или до того как переполнение возникнет (старший бит еще не попал в С

Код (Text):

@@:

test edx,10000000h

jnz переполнение

sal eax,1

rcl edx

loop @B

q_q · 19 авг 2004

shoo

Разве старший бит - это не 80000000h?

Проверять его можно короче

Код (Text):

test edx,edx

js переполнение

или

Код (Text):

or edx,edx

js переполнение

S_T_A_S_ · 19 авг 2004

imho, лучше не юзайть всякие shrd и loop, они любой пень превращают в 486..

Разве что когда размер очень критичен.

shoo · 19 авг 2004

1. насчет 10000000 прогнал спросоня

2. насчет оптимальности - не возражаю, только не так - "вот очень оптимальный код, только то что нужно - не делает"

пс - а я всегда думал, что ор и энд обнуляют перенос ?

q_q · 19 авг 2004

shoo

2 ... только не так

Это в мой адрес?

shoo · 19 авг 2004

не, это из опыта - бывает че-нибудь пишешь и сразу хочется пооптимальней, а потом дундохаешься, пока в отладчике по шагам не отловишь

shoo · 19 авг 2004

rol edx, cl

rol eax, cl

shl ebx, cl

здесь, по-моему, как минимум cl восстанавливать надо в промежутках

shoo · 19 авг 2004

да, глянул - можно or edx,edx, а потом js ...

пс: глянул еще - хе-хе, с моими настройками баузера код выглядит мелким, так что я js с jc перепутал - неуглядел

псс: ужо браузер перестроил, чтобы казусов не было

S_T_A_S_ · 19 авг 2004

shoo >

rol edx, cl

rol eax, cl

shl ebx, cl

здесь, по-моему, как минимум cl восстанавливать надо в промежутках
Нажмите, чтобы раскрыть...

Зачем? Он же не меняется.

Мой код вполне рабочий для cl до 31 включительно, на K7 и P6 это быстрее чем shld и учитывает перенос.

Для бОльших значений лучше использовать код Artem, добавив проверку на переполнение:

Код (Text):

test edx,edx

jnz overflow

shl eax,cl

mov edx,eax

xor eax,eax

Войти или зарегистрироваться

Сдвиг (длинная арифметика)

Loger New Member

Artem New Member

Loger New Member

Artem New Member

Chingachguk New Member

S_T_A_S_ New Member

shoo New Member

q_q New Member

S_T_A_S_ New Member

shoo New Member

q_q New Member

shoo New Member

shoo New Member

shoo New Member

S_T_A_S_ New Member

Войти или зарегистрироваться

Сдвиг (длинная арифметика)

Loger New Member

Artem New Member

Loger New Member

Artem New Member

Chingachguk New Member

S_T_A_S_ New Member

shoo New Member

q_q New Member

S_T_A_S_ New Member

shoo New Member

q_q New Member

shoo New Member

shoo New Member

shoo New Member

S_T_A_S_ New Member

Быстрый поиск