Задачка о длине числа

murder · 27 мар 2010

В eax содержится число без знака [0..2³²). Необходимо подсчитать количество разрядов этого числа в десятичном представлении. Например для числа 100110b=38d длина равна 2. Код без условных переходов, оптимизируем по скорости.

S_Alex · 27 мар 2010

количество разрядов числа X в десятичном представлении = 0.43429448190325182765*ln(X)+1
И нет никаких условий и переходов. Для расчетов юзай FPU. Может по скорости и не очень оптимально, но должно работать.

murder · 27 мар 2010

S_Alex
Это совсем не оптимально

Black_mirror · 27 мар 2010

murder
наиболее быстрое будет что-то типа bsr/log₂(10), а потом по таблице сравнить исходное число со степенью десятки и при необходимости скорректировать результат на 1

persicum · 27 мар 2010

С высокой точностью Длина_в_битах*3/10

Для деления на 10 вроде можно юзать команды двоично-десятичной перепаковки...

Ну вопщем до ума сам доведешь... Скорректируешь если что...

murder · 27 мар 2010

Black_mirror
Я тоже так подумал

Код (Text):

function numlen(x: dword): dword;register;assembler;

const

declen: array[0..31] of byte =(1,1,1,1,1,2, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 9, 9, 10, 10 );

decnum: array[0..31] of dword=(9,9,9,9,9,99,99,99,999,999,999,9999,9999,9999,9999,99999,99999,99999,999999,999999,999999,9999999,9999999,9999999,9999999,99999999,99999999,99999999,999999999,999999999,4294967295,4294967295);

//0,1,2,3,4,5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31

asm

cdq

bsr edx,eax

cmp dword[decnum+edx*4],eax

adc edx,0

movzx eax,byte[declen+edx]

end;

Можно ещё попробовать lzcnt вместо bsr - будет немного быстрее.

А можно без таблицы?

PowerASM · 27 мар 2010

Код (Text):

finit

push eax

fld1 ; загрузка 1

fild [x] ; загрузка x

; настройка режима округления на отбрасывание дробной части

fstcw [esp]

or byte [esp+1], 12

fldcw [esp]

; первое действие 1*log(2,x)

fyl2x

; второе действие 1*log(2,x)/log(10,2)

fldl2t ; загрузка log(2,10)

fdivp

; третье действие round(1*log(2,x)/log(2,10))+1

fistp dword [esp]

pop eax

inc eax

если убрать настройку режима округления будет красивее, но вот скажи те: чего тут не оптимального? без переходов, 3 действия, 3 загрузки и одна выгрузка + настройка режима округления

Black_mirror · 27 мар 2010

murder
Если двоичный логарифм сразу преобразовать в десятичный, то табличка потребуется всего одна на 10 элементов. Ну а без таблички можно попробовать 10 возвести в полученую степень и сравнить для коррекции, хотя бинарный поиск наверно будет быстрее в таком случае.

murder · 27 мар 2010

PowerASM
Ну вот приблизительная таблица

Код (Text):

инструкция такты

finit ~100

fldcw ~10

fyl2x ~100

fdivp ~20

В Optimization Guide for AMD family 10h пишут, что латентность fyl2x равна 13, а fyl2xp1 - 114. Проверил на своём Athlon II 250 и оказалось, что fyl2x в 4 раза быстрее чем fyl2xp1. Это конечно не 13 тактов но всё же. Интересно как обстоят дела у интел.

murder · 27 мар 2010

persicum
Результат получается приближённый.

Black_mirror

Если двоичный логарифм сразу преобразовать в десятичный
Нажмите, чтобы раскрыть...

Код в студию

persicum · 27 мар 2010

persicum
Результат получается приближённый
Нажмите, чтобы раскрыть...

что значит приближенный, плюс минус один или хуже?
ИМХО точный результат не даст ни один быстрый алгоритм, пока явно не выпишишь число в виде десятичного стринга и не посчитаешь цифры. Так ли уж сильно будут различатся двоичная запись у 99999 и 100000 например.

murder · 27 мар 2010

persicum
Ну да - там плюс минус 1.

ИМХО точный результат не даст ни один быстрый алгоритм
Нажмите, чтобы раскрыть...

http://www.wasm.ru/forum/viewtopic.php?pid=372436#p372436

Black_mirror · 27 мар 2010

murder
у Уорена в конце 11й главы:

Код (Text):

int ilog10(unsigned x)

{

int y;

static unsigned table2[11]={0,9,99,...,999999999,0xFFFFFFFF};

y=(19*(31-nlz(x)))>>6;

y=y+((table2[y+1]-x)>>31);

return y;

}

31-nlz(x) - это номер старшего единичного бита.

А вот моя безобразная версия:

Код (Text):

mov eax,10

cmp ecx,10^9

sbb eax,0

cmp ecx,10^8

sbb eax,0

....

cmp ecx,10^2

sbb eax,0

cmp ecx,10^1

sbb eax,0

Twister · 27 мар 2010

А можно без таблицы?
Нажмите, чтобы раскрыть...

Можно, но быстрее и элегантнее способа не состряпать, чем твой вариант с таблицей.

Суть в чем: с помощью fbstp можно перевести число в BCD. Т.е. имея 013d получим 013h, далее с помощью bsr найдем самый старший бит, установленный в единицу. Ну и зная, что в BCD один разряд соответствует четырем битам, легко найдем кол-во разрядов. Есть, правда, один подводный камень - BCD-вариант числа 0xFFFFFFFF не залезет в один DWORD, это надо учесть.

В общем, вполне рабочий метод, правда ни по размеру кода, ни по скорости он не подойдет

PowerASM · 27 мар 2010

murder
вам что мало ~10`000`000 вычислений в секунду для 3,0 ГГц процессора. (Хотя я бы не стал считать такты - это бесполезно. У современного проца это число может варьироваться.) К тому же для циклических алгоритмов инициализацию (finit) и настройку округления можно из цикла вынести, что почти в двое ускорит выполнение (судя по вашей таблице)

murder · 27 мар 2010

Black_mirror
На данный момент твой код лучший из не табличных.

Вот моя реализация Уоренновского алгоса

Код (Text):

function numlen(x: dword): dword;register;assembler;

const

table: array[0..10] of dword=(0,9,99,999,9999,99999,999999,9999999,99999999,999999999,$FFFFFFFF);

asm

cdq

bsr edx,eax

imul edx,edx,19

shr edx,6

cmp dword[table+edx*4+4],eax

adc edx,1

mov eax,edx

end;

Похоже идея аналогична той, что предложил persicum, только множитель и делитель другие. Я пока не в силах понять как именно работают умножение+деление.

murder · 27 мар 2010

PowerASM
Но ведь в этом и заключается дзен.

PowerASM · 27 мар 2010

и в чем же. сидеть неделю ради задачки, которую в быстром случае можно сделать таблицей, в коротком случае на сопроцессоре.

murder · 27 мар 2010

Ну в общем-то эта тема из разряда "Мелкие задачки для крупных мозгов" и изначально не предполагает какой-либо практической ценности.

Black_mirror · 27 мар 2010

еще один вариант без таблицы, двоичный поиск(может быть с багами):

Код (Text):

mov eax,1;число цифр

mov ebx,1

mov ecx,5

mov edx,10000

cmp esi,edx;сравниваем число с серединой диапазона

cmovae eax,ecx

cmovae ebx,edx

lea ecx,[eax+2]

imul edx,ebx,100

cmp esi,edx

cmovae eax,ecx

cmovae ebx,edx

lea ecx,[eax+2]

imul edx,ebx,100

cmp esi,edx

cmovae eax,ecx

cmovae ebx,edx

imul edx,ebx,10

cmp esi,edx

sbb eax,-1

Войти или зарегистрироваться

Задачка о длине числа

murder Member

S_Alex Alex

murder Member

Black_mirror Active Member

persicum New Member

murder Member

PowerASM New Member

Black_mirror Active Member

murder Member

murder Member

persicum New Member

murder Member

Black_mirror Active Member

Twister New Member

PowerASM New Member

murder Member

murder Member

PowerASM New Member

murder Member

Black_mirror Active Member

Войти или зарегистрироваться

Задачка о длине числа

murder Member

S_Alex Alex

murder Member

Black_mirror Active Member

persicum New Member

murder Member

PowerASM New Member

Black_mirror Active Member

murder Member

murder Member

persicum New Member

murder Member

Black_mirror Active Member

Twister New Member

PowerASM New Member

murder Member

murder Member

PowerASM New Member

murder Member

Black_mirror Active Member

Быстрый поиск