Log in or Sign up

время выполнения ассемблерной команды

Discussion in 'WASM.ASSEMBLER' started by babandr, Mar 16, 2009.

Page 1 of 2

babandr New Member

Blog Posts:

0

Joined:

Jun 18, 2005

Messages:

29

Location:

Voronesh

Здравствуйте, форумцы!
Дистрибутив MASM'а включает в себя неплохой хелп по асмовым опкодам и в этом хелпе есть также информация о том, сколько тактов затрачивается на выполнение той или иной команды на процессорах Intel (8086,386,486).

Внимание, вопрос...
Где бы найти подобную информацию (по количеству тактов), но для команд процессоров вплоть до Pentium4? В интеловской документации этого, к сожалению, нету; там только описание инструкций...
У Агнера Фога все как-то размыто...да и далеко не исчерпывающе.

babandr, Mar 16, 2009

#1
Y_Mur Active Member

Blog Posts:

0

Joined:

Sep 6, 2006

Messages:

2,494

Воспользоваться поиском по wasm, в поле "Поиск автора" внеси leo

Y_Mur, Mar 16, 2009

#2
Medstrax Забанен

Blog Posts:

0

Joined:

Jul 18, 2006

Messages:

673

babandr said:

В интеловской документации этого, к сожалению, нету;
Click to expand...

Куда делось то? ))

Medstrax, Mar 16, 2009

#3
babandr New Member

Blog Posts:

0

Joined:

Jun 18, 2005

Messages:

29

Location:

Voronesh

Medstrax, смотрел вот тут:
http://www.intel.com/products/processor/manuals/index.htm

ближайшее к теме - описание инструкций, но времени выполнения нету нигде.

babandr, Mar 16, 2009

#4
Medstrax Забанен

Blog Posts:

0

Joined:

Jul 18, 2006

Messages:

673

Глянь Intel® 64 and IA-32 Architectures Optimization Reference Manual

Medstrax, Mar 16, 2009

#5
leo Active Member

Blog Posts:

0

Joined:

Aug 4, 2004

Messages:

2,542

Location:

Russia

babandr

У Агнера Фога все как-то размыто...да и далеко не исчерпывающе
Click to expand...

Значительно более "исчерпывающе", чем в интеловском мануле. Из официальных мануалов только у АМД приведены латентности всех команд (да еще и их разновидностей), а у Интел - только выборочно и только для регистровых операций

leo, Mar 16, 2009

#6
babandr New Member

Blog Posts:

0

Joined:

Jun 18, 2005

Messages:

29

Location:

Voronesh

Medstrax, спасибо большое...не досмотрел я до конца этот документ...виноват.

babandr, Mar 16, 2009

#7
deLight New Member

Blog Posts:

0

Joined:

May 26, 2008

Messages:

879

расстрэлять!

deLight, Mar 16, 2009

#8
MirrorBlack Алексей

Blog Posts:

0

Joined:

Jun 21, 2008

Messages:

249

Location:

Moscow

Забей на такты.
Круто конечно хвалиться что у тебя прога на 3 такта быстрее пашет после оптимизации
Однако, когда говрят про оптимизацию, часто забывают про очередь предвыборки команд, переименование регистров и т.д.
А сие не маловажно.
Как показывает практика овчинка выделки не стоит. Самому в общем плане понимать как работает - надо, но использовать во всей красе...
Основные усилия надо прилагать к оптимизации алгоритмов программы (например где кучи циклов намешаны).

MirrorBlack, Mar 16, 2009

#9
Mikl___ Супермодератор Staff Member

Blog Posts:

14

Joined:

Jun 25, 2008

Messages:

3,917

MirrorBlack
Агнера Фога, наверное, тоже кто-нибудь призывал "забить". Пока сам себе шишек на лоб не набъёшь -- к чужому мнению не прислушиваешься

Mikl___, Mar 16, 2009

#10
MirrorBlack Алексей

Blog Posts:

0

Joined:

Jun 21, 2008

Messages:

249

Location:

Moscow

Mikl___

Агнера Фога, наверное, тоже кто-нибудь призывал "забить".
Click to expand...

Фог на этом деньги зарабатывает.

Пока сам себе шишек на лоб не набъёшь -- к чужому мнению не прислушиваешься
Click to expand...

Согласен полностью.

Любая документация (даже от Intel) неполная и изобилует косяками. Для широких масс ВСЕ сурьёзные вопросы закрыты (например регистры MSR).

MirrorBlack, Mar 16, 2009

#11
Mikl___ Супермодератор Staff Member

Blog Posts:

14

Joined:

Jun 25, 2008

Messages:

3,917

[offtop]
MirrorBlack

Для широких масс ВСЕ сурьёзные вопросы закрыты (например регистры MSR).
Click to expand...

только 4aра этого не говори, не переживет
[/offtop]

Mikl___, Mar 16, 2009

#12
Medstrax Забанен

Blog Posts:

0

Joined:

Jul 18, 2006

Messages:

673

leo said:

Значительно более "исчерпывающе", чем в интеловском мануле.
Click to expand...

Нельзя не согласиться. Правда меня всегда мучал вопрос - откуда у него вся эта инфа? Как пишет сам Фог: "The information is based on my own research and measurements rather than on official sources". С трудом верится, что не имея доступа к внутренней документации Intel(AMD), путем одних только "research and measurements" можно наковырять СТОЛЬКО инфы.
Хотя... Имея хардварный дебугер, наверное можно узнать немало...

Medstrax, Mar 16, 2009

#13
Mikl___ Супермодератор Staff Member

Blog Posts:

14

Joined:

Jun 25, 2008

Messages:

3,917

Medstrax
"Пусть даже вероятность истинности теории близка к нулю. До тех пор, пока теория не опровергается реальными экспериментальными данными, а также позволяет предсказывать эти экспериментальные данные, абсолютно не важно, верна она или нет" © l_inc

Mikl___, Mar 16, 2009

#14
Y_Mur Active Member

Blog Posts:

0

Joined:

Sep 6, 2006

Messages:

2,494

Хотя... Имея хардварный дебугер, наверное можно узнать немало...
Click to expand...

Вполне достаточно rdtsc + мозг, главное иметь достаточно времени и желания на тестирование и осмысливание )

Y_Mur, Mar 16, 2009

#15
babandr New Member

Blog Posts:

0

Joined:

Jun 18, 2005

Messages:

29

Location:

Voronesh

MirrorBlack, мне по любому приходится забивать на такты, потому как пишу на ц-дваплюса...Просто как-то недавно прочел в свободное время книгу Касперыча про оптимизацию программ и от нефига делать решил немного поэкспериментировать. Оказывается - оно того стоит; переписывать все, конечно же, глупо...но ежели есть возможность , то почему бы и нет?

babandr, Mar 17, 2009

#16
MirrorBlack Алексей

Blog Posts:

0

Joined:

Jun 21, 2008

Messages:

249

Location:

Moscow

babandr
Вот что я ещё хочу сказать про оптимизацию кода:
Берём книгу Зубкова С.В. Assembler для DOS, Windows и UNIX (в сети видел), и открываем её на 582 странице.
Находим всеми ругаемую команду LOOP и смотрим время её выполнения (в тактах):
8087 - 17
80186 - 15
80286 - 8
80386 - 11
остальные процессоры не беру, т.к. там уже более сложно считается.
Что можно увидеть в этой таблице? А собственно ничего! На более свежем процессоре команда может выполняться дольше...
Учесть все процессоры - утопия.
Давайте рассмотрим следующий код:
40ffe loop @B
и
40ffe dec ecx
40fff jnz @B
Первым значением я указал адрес памяти. Что произойдёт при выгрузке страницы в файл подкачки?
Первый вариант выгрузится и загрузится нормально, а в случае подкачки второго прийдётся грузить две страницы.
Что ещё можно сказать про оптимизацию?
Основное время в программе (почти в любой) проходит в обработке вызовов API.
И любая функция вызывается через промежуточный вызов (т.е. call идёт на jmp и т.д.). В случае COM всё ещё плачевней.
Отсюда вывод - забить на оптимизацию на уровне кода и работать над эфективностью алгоритмов.
Повторюсь - для общего развития надо, а для использования...
Сам после 15 лет asm перешёл на C++, пусть компилятор сам разбирается что к чему
Касперского ещё не читал (хотя купил), посмотрю обязательно.

MirrorBlack, Mar 17, 2009

#17
Ustus New Member

Blog Posts:

0

Joined:

Aug 8, 2005

Messages:

834

Location:

Харьков

MirrorBlack

Касперского ещё не читал (хотя купил), посмотрю обязательно.
Click to expand...

Книжка интересная, но, к сожалению на сегодня уже практически полностью устарела. Или к счастью. Особенностей, рассматриваемых в книге современные железяки уже практически не имеют.

Ustus, Mar 20, 2009

#18
Pavia Well-Known Member

Blog Posts:

0

Joined:

Jun 17, 2003

Messages:

2,409

Location:

Fryazino

остальные процессоры не беру, т.к. там уже более сложно считается.Что можно увидеть в этой таблице? А собственно ничего! На более свежем процессоре команда может выполняться дольше...Учесть все процессоры - утопия.
Click to expand...

Утопия это думать что за 20 лет процессоры не изменились. И расматривать 386 нестоит. Бери более современный pentium4, core 2 due.

Первый вариант выгрузится и загрузится нормально, а в случае подкачки второго прийдётся грузить две страницы.Что ещё можно сказать про оптимизацию?
Click to expand...

И какая вероятность того что цикл окажетья на границе страниц? 1/размер страницы. Менее 1% расматривать не стоит. Во вторых есть предвыборка. Так что штраф на проверку не накладывается.
Какова вероятность странице оказаться в файле подкачки? Да минимальна. Дупустим так сколько у нас страниц? 4Гб/4кб милион. И того так как вероятности перемножаются получаем вероятность менее 1^-9. На такое даже заморачиваться не стоит.

Основное время в программе (почти в любой) проходит в обработке вызовов API.
Click to expand...

А вы мерили? Откуда данные?

Pavia, Mar 20, 2009

#19
MirrorBlack Алексей

Blog Posts:

0

Joined:

Jun 21, 2008

Messages:

249

Location:

Moscow

Pavia

Утопия это думать что за 20 лет процессоры не изменились.
Click to expand...

Пример я привёл СПЕЦИАЛЬНО чтоб показать что меняется ВСЁ. И то что сегодня от Фога реально - завтра белибердой окажется...

И какая вероятность того что цикл окажетья на границе страниц?
Click to expand...

Согласен - ничтожная. Но мы начали считать такты и такой пример не помешает.

Какова вероятность странице оказаться в файле подкачки?
Click to expand...

На сервере - огромная.

А вы мерили? Откуда данные?
Click to expand...

Возмите SoftIce и пробегитесь с ним по свом программам. Я думаю будете "приятно" удивлены. Только советую для полноты ощущений использовать для трассировки F8.

MirrorBlack, Mar 20, 2009

#20

(You must log in or sign up to reply here.)

Page 1 of 2

Search