Как загрузить в FPU число без знака?

AsmGuru62 · 1 июн 2010

Есть инструкция FILD, но она "видит" знак числа.
Может кто знает инструкцию для беззнаковых чисел?
Просмотрел все инструкции из руководства Intel - вроде нет такого.

Делаю пока таким образом:

Если бит 31 == 1, то снимаю этот бит и затем (после FILD) добавляю 2 в степени 31.
Но морока это конечно.

Black_mirror · 1 июн 2010

AsmGuru62
sub [int16],8000h
fild [int16]
fisub [C8000];=8000h

Mikl___ · 1 июн 2010

AsmGuru62
я бы сделал так

Код (Text):

a dw 0FFFFh

shr a,1; убираю значение из знакового разряда

fild a;гружу в FPU

fadd st,st; удваиваю

jnc @f; операции в FPU не влияют на регистр флагов

fld1; если был перенос добавляю 1

fadd st,st(1)

@@: ...

Mikl___ · 1 июн 2010

AsmGuru62
а можно и не заморачиваться

Код (Text):

a dw 0FFFFh

b dd 0FFFFFFFFh

movzx ebx,a; расширяем word до dword'a

push ebx

fild dword ptr [esp];грузим результат в FPU

push 0; расширяем dword до qword'a

push b

fild qword ptr [esp];грузим результат в FPU

add esp,12; приводим стек в нормальное состояние

AsmGuru62 · 1 июн 2010

Mikl___
То что надо!
FILD 64-битный бывает!
Это я просмотрел - старею, однако...

leo · 1 июн 2010

То что надо!
А что надо ? Нехилые тормоза на чтение 8 байт после записи двух по 4 (store-to-load forwarding stall) ?!

Еще вариантик:

Код (Text):

f32 dd 0, 4F800000h ;2^32 в формате single

fild [i32]

mov eax,[i32]

shr eax,31

fadd dword ptr [f32+eax*4]

Ustus · 2 июн 2010

leo
ну я бы проще сделал...

Код (Text):

bs dd 4F800000h

sub [i32], 80000000h

fild [i32]

fadd [bs]

gcc вообще не заморачивается:

Код (Text):

xorl %edx, %edx

movl 16(%esp), %eax

movl %edx, 4(%esp)

movl %eax, (%esp)

fildq (%esp)

ms тоже

Код (Text):

fild DWORD PTR _x$[esp-4]

test eax, eax

jge SHORT $LN3@ff

fadd QWORD PTR __real@41f0000000000000

$LN3@ff:

Ustus · 2 июн 2010

leo
З.Ы. давненько вас чего-то видно не было

PSR1257 · 2 июн 2010

А что, в самом FPU нету FABS? Или это некошерно по соображениям производительности?

Ustus · 2 июн 2010

PSR1257
Я так понял, что тк надо, чтобы при наличии числа скажем 3753753753h в копроцессор загружалось 3753753753, а не -541213543.
Ну и при чем здесь FABS? Получить не -541213543, а 541213543? Ржунимагу.

Ustus · 2 июн 2010

AsmGuru62
А можно на x64 и с SSE3?

AsmGuru62 · 2 июн 2010

Замечательный поток предложений - буду учиться!
Про stall (large load after two short stores) - это верно. В принципе скорости мне не надо, но всё таки интересно покопать!
Дисассемблировать как хороший компилер это делает - тоже неплохая идея.

AsmGuru62 · 2 июн 2010

leo
Твой код работает великолепно!

Mikl___ · 2 июн 2010

AsmGuru62
leo только бы поворчать, о быстродействии в ТЗ не было ни слова и мой вариант с пушами ничем не отличается от варианта gcc только push eax поменять на mov [esp],eax

leo · 2 июн 2010

Ustus

ну я бы проще сделал...
Нажмите, чтобы раскрыть...

Во-первых, аналогичный вариант уже Black_mirror предложил в #2 (правда с опечаткой fisub вместо fiadd). Во-вторых, он "проще" по размеру\числу_команд, а по кол-ву "блох" (микроопераций и их зависимости) - "хуже" Ну и самое главное - он изменяет исходный операнд, что во многих случаях недопустимо

gcc вообще не заморачивается..
ms тоже
Нажмите, чтобы раскрыть...

ms "заморачивается", т.к. partial write тормозит всегда, а jcc только в случае непредсказанного перехода

Mikl___

leo только бы поворчать...мой вариант с пушами ничем не отличается от варианта gcc...
Нажмите, чтобы раскрыть...

В данном случае я не ворчу, а просто принимаю посильное участие, вставляя свои 5 копеек
А вариант с пушами и мувами юзается и gcc, и борманом, т.к. он прост и очевиден "как валенок". С загрузкой беззнакового целого еще можно как-то обойтись без partial write, а вот при передаче double в функцию (по значению) наверняка все компилеры юзают пуши и "ворчать" тут бесполезно - можно только самому "заморачиваться" и передавать их по ссылке\указателю

Black_mirror · 2 июн 2010

leo
Никакой опечатки там нет, там числа просто двухбайтовые.

leo · 2 июн 2010

Black_mirror
Упс, пардон. Не учел, что вычитание - целочисленное и соотв-но 8000h воспринимается как отрицательное и "минус на минус дает плюс"

Ustus · 2 июн 2010

leo

аналогичный вариант уже Black_mirror предложил в #2
Нажмите, чтобы раскрыть...

Не заметил, торможу

о кол-ву "блох" (микроопераций и их зависимости) - "хуже"
Нажмите, чтобы раскрыть...

Это да.

С загрузкой беззнакового целого еще можно как-то обойтись без partial write, а вот при передаче double в функцию (по значению) наверняка все компилеры юзают пуши и "ворчать" тут бесполезно - можно только самому "заморачиваться" и передавать их по ссылке\указателю
Нажмите, чтобы раскрыть...

Переходите на x64 Кстати, многие компилеры умеют и на 32 передавать double через регистры, если их как следует попросить. Правда это нифига не стандартизовано, что плохо.

Mikl___ · 3 июн 2010

Ustus сказал(а):

многие компилеры умеют и на 32 передавать double через регистры, если их как следует попросить
Нажмите, чтобы раскрыть...

Покажите как, просто интересно...

Ustus · 3 июн 2010

Mikl___
Ну вообще-то я имел ввиду SSE. С FPU такое можно проделать только через извращения. Например Watcom'овский компилер в свое время был очень популярен в частности потому, что хорошо оптимизил вещественную арифметику сам по себе и кроме того позволял чуть ли не собственные соглашения вызовов сочинить используя pragma aux.

Войти или зарегистрироваться

Как загрузить в FPU число без знака?

AsmGuru62 Member

Black_mirror Active Member

Mikl___ Супермодератор Команда форума

Mikl___ Супермодератор Команда форума

AsmGuru62 Member

leo Active Member

Ustus New Member

Ustus New Member

PSR1257 New Member

Ustus New Member

Ustus New Member

AsmGuru62 Member

AsmGuru62 Member

Mikl___ Супермодератор Команда форума

leo Active Member

Black_mirror Active Member

leo Active Member

Ustus New Member

Mikl___ Супермодератор Команда форума

Ustus New Member

Войти или зарегистрироваться

Как загрузить в FPU число без знака?

AsmGuru62 Member

Black_mirror Active Member

Mikl___ Супермодератор Команда форума

Mikl___ Супермодератор Команда форума

AsmGuru62 Member

leo Active Member

Ustus New Member

Ustus New Member

PSR1257 New Member

Ustus New Member

Ustus New Member

AsmGuru62 Member

AsmGuru62 Member

Mikl___ Супермодератор Команда форума

leo Active Member

Black_mirror Active Member

leo Active Member

Ustus New Member

Mikl___ Супермодератор Команда форума

Ustus New Member

Быстрый поиск