Возведение числа в степень... (возможные варианты и их улучшение)

locki · 4 апр 2007

Есть маленькая задача "возвести число X в степень Y" я реализовал это так:

Код (Text):

function alu_power(x,y:longint):longint;

begin

y:=y-1;

asm

mov eax, x

mov ecx, 1

@rep:

mul eax, x

inc ecx

cmp y, ecx

jae @rep

mov @result, eax

end;

end;

и вот так:

Код (Text):

function fpu_Power(const x, y: extended): extended; //x>0!

asm

fld y

fld x

fyl2x

fld st(0)

frndint

fsubr st(0),st(1)

f2xm1

fld1

faddp

fscale

fxch st(1)

fstp st

end;

Вопрос как ускорить работу данных вариантов.
И просьба написать примеры с использыванием MMX, SSE,SSE2...

censored · 4 апр 2007

asm
mov eax, x
mov ecx, 1
@rep:
mul eax, x
inc ecx
cmp y, ecx
jae @rep
mov @result, eax
end
Нажмите, чтобы раскрыть...

вроде цикл dec ecx / jnz @rep будет быстрее...

locki · 4 апр 2007

хм...

Код (Text):

function alu_power2(x,y:longint):longint;

begin

y:=y-1;

asm

mov eax, x

mov ecx, y

@rep:

mul eax, x

dec ecx

jnz @rep

mov @result, eax

end;

end;

дает прирост 2,44% на P4 3.2Ghz Prescott-2m

Booster · 4 апр 2007

locki
Логарифмическое возведение для достаточно больших чисел будет быстрее.
То есть 2^4 = (2^2)^2.

Да и зачем:

dec ecx
jnz @rep
Нажмите, чтобы раскрыть...

Есть же loop.

UbIvItS · 4 апр 2007

lockiЛогарифмическое возведение для достаточно больших чисел будет быстрее.То есть 2^4 = (2^2)^2.
Нажмите, чтобы раскрыть...

ты прав - быстрей, но расход памяти выше, например: число в 1024 бит требует массив в 1024 элементов

Booster · 4 апр 2007

UbIvItS

число в 1024 бит требует массив в 1024
Нажмите, чтобы раскрыть...

Ты имеешь ввиду, если сохранять все предыдущие расчёты.
Да, увеличение скорости увеличивает расход памяти. Но можно сохранять только последнуюю степень, скорость конечно несколько упадёт, но расход памяти всего на одну переменную.

locki · 4 апр 2007

Замещение логарифмом ускорения не даст, так как степени маленькие (макс 4),
а числа большие...
А может ускорит процесс введение ммх или SSe?

PaCHER · 4 апр 2007

Код (Text):

mov eax,x

mov ebx,eax

muv ecx,y

@@: mul ebx

dec ecx

jnz @b

mov rezult,edx

mov [offset result+4],eax

UbIvItS · 4 апр 2007

Ты имеешь ввиду, если сохранять все предыдущие расчёты.Да, увеличение скорости увеличивает расход памяти. Но можно сохранять только последнуюю степень, скорость конечно несколько упадёт, но расход памяти всего на одну переменную.
Нажмите, чтобы раскрыть...

Во - первых, я прогнал)) - кол-во элементов массива зависит от степени, в кою число возводишь.
сохранять последнюю степень - разницы не будет ощущаться на малых степенях, а на больших будет требоваться доп. пересчет.
кстати, ету схемку и для того, чтоб логарифм щимить юзать можно.
хотя, все элементы массива нам не нужны - мы можем заранее просчитать, кои степени a^(2^i) нужны, чтоб получить a^x.

Booster · 4 апр 2007

locki

А может ускорит процесс введение ммх или SSe?
Нажмите, чтобы раскрыть...

Если сможешь распараллелить, то ускорит.
Можно так 2^4:
Делаем параллельно операции.
1)
2*2
2)
2*2
Затем перемножаем эти результаты.
Но смысла это делать не вижу, так как вычислять хоть и параллельно, но одно и тоже довольно странно, уж лучше делать логарифмом.

UbIvItS
Ну я имел ввиду сохранять все высчитаные раннее степени, чтобы снова их не считать, так что IMHO смысл того, что ты хотел сказать понятен.

UbIvItS · 4 апр 2007

на пример нам нужно найти A^73: 73=2^16+2^3+1 - таким образом нам нужны A^64, A^8, A

Booster · 4 апр 2007

на пример нам нужно найти A^73: 73=2^16+2^3+1 - таким образом нам нужны A^64, A^8, A
Нажмите, чтобы раскрыть...

Да, но это для этого конкретного случая, а в общем случае могут понадобиться все степени.

UbIvItS · 4 апр 2007

Да, но это для этого конкретного случая, а в общем случае могут понадобиться все степени.
Нажмите, чтобы раскрыть...

какие степени тебе нужны, ты можешь заранее просчитать - это не проблемма.

Y_Mur · 4 апр 2007

http://www.wasm.ru/forum/viewtopic.php?id=9936

CreatorCray · 5 апр 2007

Вообще классический алго для возведения в целочисленную степень примерно такой:
псевдокод:
для v > 0, e > 0

Код (Text):

int pow (int v, int e)

{

int res = v;

int loop = bsr (e)-1; // bsr - bit scan reverse :)

while (loop--)

{

res *= res; // возводим в квадрат

if (e & (1<<loop))

res *= v;

}

return res;

}

И для проверки вспомнил молодость...

Код (Text):

int wmain ()

{

DWORD v,e,r;

v = 2;

e = 31;

_asm

{

mov eax, DWORD ptr [v]

mov esi, eax

mov edi, DWORD ptr [e]

bsr ecx, edi

mov ebx, 2

shl ebx, cl

l1:

jecxz l2

dec ecx

shr ebx, 1

mul eax

test edi, ebx

jz l1

mul esi

jmp l1

l2:

mov DWORD ptr [r], eax

}

printf ("%u ^ %u = %u\n",v,e,r);

}

CreatorCray · 5 апр 2007

Кстати посмотрел IDA-й код для intrinsic pow из комплекта к Intel C++ 9.1
Убиццо веником! Кода километр %(
Есть 2 версии - одна под SSE, вторая на сопроцессоре.

Booster · 5 апр 2007

CreatorCray
Да, безусловно эта реализация рулит.
UbIvItS
Заранее считать и хранить ничего не надо, что то я тоже стал забывать простые вещи. -).

UbIvItS · 5 апр 2007

точней код должен выглядить так:

Код (Text):

int pow (int v, int e)

{

int res = 1;

int loop = bsr (e); // bsr - bit scan reverse :)

for(int i=0; i<loop; i++)

{

if (e & (1<<i)) res *= v;

v *= v; // возводим в квадрат

}

return res;

}

CreatorCray · 6 апр 2007

Так на 1 цикл умножений больше.
Во первых нафига делать абсолютно не нужное умножение на 1?
Проверку на нулевую степень нужно выносить за цикл а не замедлять алго ради него.
Во вторых - зачем делать абсоютно не нужное возведение в квадрат в последнем цикле? Ведь в последнем цикле v *= v уже выполняет никому не нужную работу.

Так что я настаиваю на моем варианте.

locki · 6 апр 2007

что здесь не верно:

Код (Text):

function mmx_power(x,y:longint):longint;

begin

y:=y-1;

asm

MOVd mm0,x

MOVd mm1,x

mov ecx, y

@rep:

PMULLw mm0, mm1

dec ecx

jnz @rep

movd @result, mm0

emms

end;

end;

2^15 считает, а больше ноль выдает( какое-то переполнение что ли?)

Войти или зарегистрироваться

Возведение числа в степень... (возможные варианты и их улучшение)

locki New Member

censored New Member

locki New Member

Booster New Member

UbIvItS Well-Known Member

Booster New Member

locki New Member

PaCHER New Member

UbIvItS Well-Known Member

Booster New Member

UbIvItS Well-Known Member

Booster New Member

UbIvItS Well-Known Member

Y_Mur Active Member

CreatorCray Member

CreatorCray Member

Booster New Member

UbIvItS Well-Known Member

CreatorCray Member

locki New Member

Войти или зарегистрироваться

Возведение числа в степень... (возможные варианты и их улучшение)

locki New Member

censored New Member

locki New Member

Booster New Member

UbIvItS Well-Known Member

Booster New Member

locki New Member

PaCHER New Member

UbIvItS Well-Known Member

Booster New Member

UbIvItS Well-Known Member

Booster New Member

UbIvItS Well-Known Member

Y_Mur Active Member

CreatorCray Member

CreatorCray Member

Booster New Member

UbIvItS Well-Known Member

CreatorCray Member

locki New Member

Быстрый поиск