Как устроены StrToFloat и StrToInt?

Adrax · 20 янв 2007

Уважаемые программисты! Нуждаюсь в собственной ассемблерной реализации функций StrToInt и StrToFloat для перевода введенной строки символов в числовую форму
К сожалению, не обладаю достаточной квалификацией для самостоятельного дизассемблирования и реверсинга этих функций, поэтому прошу вашего совета
Буду благодарен любой подсказке

IceFire · 20 янв 2007

1. Определяем, что является разделителем целой и дробной части числа (точка или зпт)
2. Находим номер ее позиции.
3. Все, что слева, запишем в отдельную строку, справа - в отдельную
4. Посчитаем кол-во символов там и там.
5. Ну и поехали: берем первый байт левой строки, вычитам из него ASCII-код символа "0" (или "1" (?) - не помню, посмотри в таблице, что раньше идет), полученное значение умножаем на 10 в степени кол-ва знаков в левой подстроке минус текущая позиция, кидаем результат в накопитель (прибавляем к нему), затем - знак во второй позиции левой строки и т.д.
6. Для правой строки то же самое, ток умножаем на 10 в степени (-(кол-во знаков в правой подстроке минус текущая позиция)).
7. Фсе.

n0name · 20 янв 2007

Посмотри исходники KOL, там есть вариант и на асме, и на паскале.

W4FhLF · 20 янв 2007

\masm32\m32lib\ATOFP.ASM
\masm32\m32lib\ATODW.ASM

За основу возьми.

TourerV · 20 янв 2007

Посмотри исходники KOL, там есть вариант и на асме, и на паскале.
Нажмите, чтобы раскрыть...

где это посмотреть?

n0name · 20 янв 2007

http://www.kolnmck.ru/start.shtml

Adrax · 23 янв 2007

Уважаемые программисты! Огромное спасибо за советы!
Правда в исходниках KOL я не нашёл ничего подобного, но, ковыряя ATOFP и исходники одного калькулятора, дошёл до истины. Перевожу сейчас с масма на родной фасм...

Adrax · 25 янв 2007

Прошу прощения, возник ещё вопрос.
Во-первых, правильно ли я делаю:

Код (Text):

finit

fldz

cycle:

xor eax,eax

mov al,byte [esi]

inc esi

sub al,30h

jb error

cmp al,9

ja error

mov [chislo],eax

fld [ten]

fmulp st1,st

fld [chislo]

faddp st1,st

loop cycle

fstp [num10]

Во-вторых, почему, если я ввожу, например, число 1, в st0 грузится 1.4 с бешеным хвостом и порядком -45? Это нормально?
И ещё: а как вывести число? Т.е. как реализовать FloatToString?

leo · 25 янв 2007

Adrax
Во-первых = во-вторых = неправильно Для работы с целыми числами нужно использовать инструкции fiXXX, тогда и 1 будет 1.0, а не "1.4 с бешеным хвостом"
Дробление операций на fld + fXXX st1,st лишь увеличивает размер кода и нагрузку на декодер, лучше сразу использовать инструкции с операндами памяти

Код (Text):

xor eax,eax ;один раз перед циклом

cycle:

mov al,[esi]

inc esi

sub al,"0" ;jb тут не нужен - лишняя операция

cmp al,9

ja error

mov [chislo],eax

fmul [ten] ;ten dq 10.0

fiadd [chislo] ;chislo dd 0

jmp cycle ;loop cycle тут ни к селу, ни к городу ;)

И ещё: а как вывести число? Т.е. как реализовать FloatToString?
Нажмите, чтобы раскрыть...

Да все там же - \masm32\m32lib\Fptoa.asm

crypto · 25 янв 2007

Adrax
Посмотри, как это сделано у Борланда в Дельфи7 (модуль SysUtils.pas)

Код (Text):

function TextToFloat(Buffer: PChar; var Value;

ValueType: TFloatValue): Boolean;

const

// 8087 control word

// Infinity control = 1 Affine

// Rounding Control = 0 Round to nearest or even

// Precision Control = 3 64 bits

// All interrupts masked

CWNear: Word = $133F;

var

Temp: Integer;

CtrlWord: Word;

DecimalSep: Char;

SaveGOT: Integer;

asm

PUSH EDI

PUSH ESI

PUSH EBX

MOV ESI,EAX

MOV EDI,EDX

{$IFDEF PIC}

PUSH ECX

CALL GetGOT

POP EBX

MOV SaveGOT,EAX

MOV ECX,[EAX].OFFSET DecimalSeparator

MOV CL,[ECX].Byte

MOV DecimalSep,CL

{$ELSE}

MOV SaveGOT,0

MOV AL,DecimalSeparator

MOV DecimalSep,AL

MOV EBX,ECX

{$ENDIF}

FSTCW CtrlWord

FCLEX

{$IFDEF PIC}

FLDCW [EAX].CWNear

{$ELSE}

FLDCW CWNear

{$ENDIF}

FLDZ

CALL @@SkipBlanks

MOV BH, byte ptr [ESI]

CMP BH,'+'

JE @@1

CMP BH,'-'

JNE @@2

@@1: INC ESI

@@2: MOV ECX,ESI

CALL @@GetDigitStr

XOR EDX,EDX

MOV AL,[ESI]

CMP AL,DecimalSep

JNE @@3

INC ESI

CALL @@GetDigitStr

NEG EDX

@@3: CMP ECX,ESI

JE @@9

MOV AL, byte ptr [ESI]

AND AL,0DFH

CMP AL,'E'

JNE @@4

INC ESI

PUSH EDX

CALL @@GetExponent

POP EAX

ADD EDX,EAX

@@4: CALL @@SkipBlanks

CMP BYTE PTR [ESI],0

JNE @@9

MOV EAX,EDX

CMP BL,fvCurrency

JNE @@5

ADD EAX,4

@@5: PUSH EBX

MOV EBX,SaveGOT

CALL FPower10

POP EBX

CMP BH,'-'

JNE @@6

FCHS

@@6: CMP BL,fvExtended

JE @@7

FISTP QWORD PTR [EDI]

JMP @@8

@@7: FSTP TBYTE PTR [EDI]

@@8: FSTSW AX

TEST AX,mIE+mOE

JNE @@10

MOV AL,1

JMP @@11

@@9: FSTP ST(0)

@@10: XOR EAX,EAX

@@11: FCLEX

FLDCW CtrlWord

FWAIT

JMP @@Exit

@@SkipBlanks:

@@21: LODSB

OR AL,AL

JE @@22

CMP AL,' '

JE @@21

@@22: DEC ESI

RET

// Process string of digits

// Out EDX = Digit count

@@GetDigitStr:

XOR EAX,EAX

XOR EDX,EDX

@@31: LODSB

SUB AL,'0'+10

ADD AL,10

JNC @@32

{$IFDEF PIC}

XCHG SaveGOT,EBX

FIMUL [EBX].DCon10

XCHG SaveGOT,EBX

{$ELSE}

FIMUL DCon10

{$ENDIF}

MOV Temp,EAX

FIADD Temp

INC EDX

JMP @@31

@@32: DEC ESI

RET

// Get exponent

// Out EDX = Exponent (-4999..4999)

@@GetExponent:

XOR EAX,EAX

XOR EDX,EDX

MOV CL, byte ptr [ESI]

CMP CL,'+'

JE @@41

CMP CL,'-'

JNE @@42

@@41: INC ESI

@@42: MOV AL, byte ptr [ESI]

SUB AL,'0'+10

ADD AL,10

JNC @@43

INC ESI

IMUL EDX,10

ADD EDX,EAX

CMP EDX,500

JB @@42

@@43: CMP CL,'-'

JNE @@44

NEG EDX

@@44: RET

@@Exit:

POP EBX

POP ESI

POP EDI

end;

Adrax · 30 янв 2007

Огромное спасибо! Только начал постигать десятичную арифметику в ассемблере - поначалу очень сложно...

Adrax · 5 фев 2007

Уважаемые программисты! Понимаю, что всех уже достал, но - если ввод и преобразование числа я ещё понял, то с выводом возникли проблемы. Вот как я принимаю число:

Код (Text):

format PE console

include 'win32axp.inc'

section '.data' data readable writeable

ns dd ?

hout dd ?

buffer db 51 dup (?)

help db 'Usage: con_4islo.exe NUMBER',0

Retry db 'Program fails. Please, retry',0

num10 dt ?

chislo dd ?

ten dd 10

minus db ?

status dw ?

to4ka dd ?

.code

fuck:

invoke GetStdHandle,STD_OUTPUT_HANDLE

mov [hout],eax

invoke GetCommandLine

mov esi,eax

cycle1:

cmp byte [esi],20h

je parameter

cmp byte [esi],0Dh

je najobka

inc esi

jmp cycle1

parameter:

mov edi,buffer

mov ecx,50

cycle2:

inc esi

mov al,byte [esi]

cmp al,0Dh

je konets

mov byte [edi],al

inc edi

loop cycle2

konets:

invoke lstrlen,buffer

mov ecx,eax

mov esi,buffer

mov edi,esi

add edi,ecx

dec edi

xor eax,eax

finit

fldz

mov al,byte [esi]

cmp al,2Dh

je otric

cycle3:

mov al,byte [esi]

inc esi

cmp al,2Eh

je drobnoe

cmp al,2Ch

je drobnoe

sub al,30h

jb retry

cmp al,9

ja retry

mov [chislo],eax

fild [ten]

fmulp st1,st

fild [chislo]

faddp st1,st

loop cycle3

fldz

jmp NoMore

drobnoe:

dec ecx

xor eax,eax

fldz

cycle4:

mov al,byte [edi]

dec edi

sub al,30h

jb retry

cmp al,9

ja retry

mov [chislo],eax

fild [chislo]

faddp

fild [ten]

fdivp st1,st

loop cycle4

NoMore:

faddp st1,st

xor eax,eax

mov al,[minus]

test al,al

jz zagruz

fchs

zagruz:

fstp tbyte [num10]

exit:

invoke ExitProcess,0

najobka:

invoke WriteConsole,[hout],help,27,ns,NULL

retry:

invoke WriteConsole,[hout],Retry,28,ns,NULL

jmp exit

otric:

mov [minus],1

dec ecx

inc esi

jmp cycle3

.end fuck

И вот, я положил число в переменную num10 типа tbyte (это BCD формат, я так понял?) - я в принципе могу грузануть её обратно в стек FPU, провести необходимые арифметические операции, но как мне преобразовать это число в строку?
Пожалуйста, не отсылайте меня к масмовским либам, а поясните хотя бы в общих словах алгоритм разбора BCD. Я, наверное, сам смогу вывести цифры в строку, но как определить десятичный порядок и правильно поставить разделитель-точку?
Прошу вашей помощи

Zhelezovsky · 5 фев 2007

А FPU разве работает с BCD-форматом? С ним действий-то: +, -, *, / и коррекция результата (daa). А всё остальное, включая и учёт переноса-заёма - дело программиста. Почитай про BCD-числа у Юрова.

Adrax · 7 фев 2007

Гм... Повтыкал в мануалы - у меня ж не BCD получается, а число в формате extended, если я правильно понял... Как преобразовать его в строку?
Видел несколько реализаций, но там число выводится в экспоненциальной форме. А как его вывести просто, как дробное, с запятой? Как определить позицию запятой (т.е. определить десятичный порядок?)? Помогите хотя бы алгоритмом, а то никак не пойму...

leo · 7 фев 2007

Adrax
Уж и не знаю, где тебе отвечать - здесь или тут
Короче так, если ты хочешь замутить универсальную функцию с анализом порядка числа, то разбирайся в готовых реализациях (masm, delphi и т.п.) или бери их один к одному - лучше\проще все равно не сделаешь А вот сделать (достаточно) простой вариант вывода числа в децимальном виде с заданным числом знаков после запятой можно. В этом случае "определять десятичный порядок" не нужно, т.к. предполагается что пользователь сам задает "разумное" число знаков после запятой исходя из ограничения, что суммарное число десятичных цифр целой и дробной части не должно превышать 18-ти.
В этом случае алгоритм будет примерно таким:
1) создаем таблицу степеней 1.0E1, 1.0E2, ..., 1.E17
2) умножаем число на степень в соответствии с заданным числом n знаков после запятой (считаем, что fpu-исключения замаскированы finit)
3) сохраняем число в BCD-формате (fbstp)
4) проверяем старший (10-й) байт BCD на 0FFh - если равно, значит переполнение (взято слишком большое n) - грязно ругаемся и выходим (ну или уменьшаем n и повторяем попытку)
5) проверяем знак старшего байта - если установлен, то пишем '-' в строку
Дальше есть два варианта - либо сразу анализировать BCD и сохранять готовые цифры в строку (получается более навороченно), либо по простому сначала преобразовать весь BCD в промежуточную строку, а затем переписать ее с пропуском лидирующих нулей целой части и вставкой десятичной точки перед n-ным символом от конца строки. Поскольку скорость тут особо не нужна, то как правило используется именно второй вариант. <..deleted..> Попробуй такой вариант - там посмотрим

Zhelezovsky · 7 фев 2007

Ех, работает FPU... С упакованными BCD-числами, сорри.

Adrax · 9 фев 2007

2 leo
Огромное спасибо!! Просто, когда мне на словах распишут, как и что - на код переложить легче
Я понял твои слова, но решил не делать таблицу, а возводить десять в нужную степень в отдельной процедуре... Опять столкнулся с траблами (не одно, так другое) - запутался в округлении до целого
Вынес этот вопрос в отдельную тему "Округление в FPU" (здесь же, в BEGINNERS) - посмотри, там код этой процедуры - возможно, что-то не так?

Adrax · 12 фев 2007

leo
Гм... Понимаю, что достал... Спасибо за твои советы, мучаюсь потихоньку и снова задаю вопросы
Решил попытать табличный метод: заделал 18 qword'ов с разными степенями десяти и задумался: как же быстро вытащить из массива требуемое значение? Ну и решил забить их в стек по порядку, потом вычисляю, сколько цифр после запятой (сохраняю в esi), затем обрезаю всё ненужное (esp+=esi), ну и гружу qword [esp] в сопр, где и множу...
Трабла: хоть и юзаю fild, всё равно грузит какую-то белиберду типа 1,3657489... с экспонентой. Это из-за явного указания размера? А без него фасм не компилит!!

Y_Mur · 12 фев 2007

хоть и юзаю fild, всё равно грузит какую-то белиберду
Нажмите, чтобы раскрыть...

Потому и белиберду для 1.0E1, 1.0E2, ..., 1.E17 FLD предназначена
И зачем копировать всю таблицу в стек когда всё что нужно - это взять из неё одно число?
Мне в плане оптимизации до leo конечно далеко, но имхо тут нужно что-то типа
FMUL [TableName + eax*8], где eax = количество знаков после запятой

Y_Mur · 13 фев 2007

Adrax
FPU числа бывают:
обычной точности DWORD - десятичный порядок +-38, двоичная мантиса = 24 бита
двойной точности QWORD - десятичный порядок +-308, двоичная мантиса = 53 бита
расширенной точности TBYTE - десятичный порядок +-4932, двоичная мантиса = 64 бита
В данном случае мах = 1.0E17 и DWORD сойдёт, QWORD всё равно недоиспольуется.
Только не путай FPU DWORD c обычным целым DWORD

Кстати leo давно хотел спросить есть ли разница в скорости загрузки\сохранения при работе с числами разной точности?

Войти или зарегистрироваться

Как устроены StrToFloat и StrToInt?

Adrax Алексей

IceFire New Member

n0name New Member

W4FhLF New Member

TourerV New Member

n0name New Member

Adrax Алексей

Adrax Алексей

leo Active Member

crypto Active Member

Adrax Алексей

Adrax Алексей

Zhelezovsky Member

Adrax Алексей

leo Active Member

Zhelezovsky Member

Adrax Алексей

Adrax Алексей

Y_Mur Active Member

Y_Mur Active Member

Войти или зарегистрироваться

Как устроены StrToFloat и StrToInt?

Adrax Алексей

IceFire New Member

n0name New Member

W4FhLF New Member

TourerV New Member

n0name New Member

Adrax Алексей

Adrax Алексей

leo Active Member

crypto Active Member

Adrax Алексей

Adrax Алексей

Zhelezovsky Member

Adrax Алексей

leo Active Member

Zhelezovsky Member

Adrax Алексей

Adrax Алексей

Y_Mur Active Member

Y_Mur Active Member

Быстрый поиск