можно ли это оптимизировать?

t00x · Aug 27, 2007

Code (Text):

; in - al=byte

;out - ebx = bit field

;out - dl = al (если al (0xA0..0xAF)

mov bl, al ; save al

and bl, 11110000b

cmp bl, 0xA0 ; 0xA0 - 0xAF

jne @notA0

mov dl, al

xor bl, bl

jmp @next_byte

@notA0:

xor bl, bl

xor ecx, ecx

mov cl, 12

lea edi, [table_]

cld

repne scasb

bts ebx, ecx

@next_byte:

table_ db 0xF0, 0xF8, 0xFC, 0x34, 0x35, 0x36, 0x37, 0x8D, 0xF2, 0x88, 0x0F, 0

Twister · Aug 27, 2007

По скорости или размеру?

t00x · Aug 27, 2007

по скорости конечно.

Twister · Aug 27, 2007

А... а я по размеру начал и увидел, что mov dl, al можно заменить на xchg edx, eax

nobodyzzz · Aug 27, 2007

ну если по скорости то можно как минимум отказаться от партиальных регистров т.к. арифметический операций нет то безболезненно =)

t00x · Aug 27, 2007

А... а я по размеру начал и увидел, что mov dl, al можно заменить на xchg edx, eax
Click to expand...

al ещё понадобится (; save al )

n0name · Aug 27, 2007

xor bl, bl вынести перед проверкой. и размер и скорость.

xor ecx, ecx
mov cl, 12

а что мешает mov ecx, 12 ?

t00x · Aug 27, 2007

xor bl, bl вынести перед проверкой.
Click to expand...

-
P.S. не получится так x) JNE = JNZ

t00x · Aug 27, 2007

думал, может что-нибудь с
cld
repne scasb
bts ebx, ecx
сделать.
по rdtsc проходит за 240 тиков, а без этого всего за 60.

nobodyzzz · Aug 27, 2007

t00x said:

думал, может что-нибудь с
cld
repne scasb
bts ebx, ecx
сделать.
по rdtsc проходит за 240 тиков, а без этого всего за 60.
Click to expand...

ну да достаточно тормозные конструкции...
как самый очевидный вариант =)
@@:
mov dl, [edi]
inc edi
inc ecx
cmp al, dl
jnz @B
mov edx, 1
shl edx, cl
or ebx, edx
test ebx, edx

t00x · Aug 27, 2007

ну да достаточно тормозные конструкции...
Click to expand...

пробовал cmp ... + sub ecx... + ...
получается вообще >400.
table_ маленькая, может можно без неё обойтись

n0name · Aug 27, 2007

Code (Text):

@@:

cmp al, [edi]

inc edi

shl edx, 1

jnz @B

t00x · Aug 27, 2007

Code (Text):

mov eax, 0x0F

mov bl, al ; save al

and bl, 11110000b

cmp bl, 0xA0 ; 0xA0 - 0xAF

jne @notA0

mov dl, al

xor bl, bl

jmp @next_byte

@notA0:

mov ecx, 11 ;12

mov edi, table_

xor bl, bl

@@:

mov dl, [edi]

inc edi

dec ecx

jz @next_byte

cmp al, dl

jne @B

bts ebx, ecx

@next_byte:

xor dl, dl

table_ db 0xF0, 0xF8, 0xFC, 0x34, 0x35, 0x36, 0x37, 0x8D, 0xF2, 0x88, 0x0F, 0

этот код выполняется за 180 тиков.
n0name

cmp al, [edi]...
Click to expand...

меняю mov dl, edi + cmp dl, al на cmp al, [edi] - 320!

leo · Aug 28, 2007

bts это отстой

Code (Text):

; in - al=byte

;out - ebx = bit field

;out - dl = al (если al (0xA0..0xAF)

mov dl, al ; save al

and al, 0xF0

cmp al, 0xA0 ; 0xA0 - 0xAF

je @next_byte

mov ecx,11 ;12 ?

lea edi,[ecx+table_]

mov ebx,1 ;или lea ebx,[ecx-10] для мелочной экономии размера ;)

neg ecx

;align 16

@notA0:

cmp dl,[edi+ecx]

jz @found

add ebx,ebx ;=shl ebx,1

add ecx,1

jnz @notA0

@nextbyte:

xor ebx,ebx

@found:

;mov al,dl ;если нужно сохранить al

table_ db ... ;<инвертировать в обратном порядке по сравн. c bts ebx,ecx>

t00x · Aug 28, 2007

leo
cупер! 110 тиков.

Log in or Sign up

можно ли это оптимизировать?

t00x New Member

Twister New Member

t00x New Member

Twister New Member

nobodyzzz New Member

t00x New Member

n0name New Member

t00x New Member

t00x New Member

nobodyzzz New Member

t00x New Member

n0name New Member

t00x New Member

leo Active Member

t00x New Member

Log in or Sign up

можно ли это оптимизировать?

t00x New Member

Twister New Member

t00x New Member

Twister New Member

nobodyzzz New Member

t00x New Member

n0name New Member

t00x New Member

t00x New Member

nobodyzzz New Member

t00x New Member

n0name New Member

t00x New Member

leo Active Member

t00x New Member

Useful Searches