Префиксы в системе команд IA-32

Mikl___ · 15 дек 2016

Префиксы в системе команд IA-32

автор Евгений Юлюгин aka yulyugin взято здесь

Общая структура IA-32 инструкции:

Префиксы. Могут отсутствовать. Может присутствовать сразу несколько.

Опкод. Может состоять из одного, двух или трех байтов.

Mod_R/M байт. Используется для адресации операндов. Может отсутствовать в кодировке, если инструкция не имеет явных операндов.

SIB (Scale Index Base) байт. Второй байт, использующийся для адресации операндов в памяти. Может отсутствовать.

Байт смещения адреса (англ. displacement). 1, 2, 4 или ни одного байта.

Константа (англ. immediate). 1, 2, 4 или ни одного байта.

Более подробное описание структуры инструкции можно найти в Intel 64 and IA-32 Architectures Software Development Manuals. В данной статье будет рассказываться об IA-32 префиксах, особенностях, связанных с их использованием, а также тенденций в их развитии.
Однобайтные префиксы
Практически с самых первых процессоров Intel в системе команд IA-32 начали использоваться однобайтные префиксы.
Префиксы изменяющие сегментный регистр, используемый командой при обращении к ячейке памяти:
• 0x26 – префикс замены сегмента ES
• 0x2E – префикс замены сегмента CS
• 0x36 – префикс замены сегмента SS
• 0x3E – префикс замены сегмента DS
• 0x64 – префикс замены сегмента FS
• 0x65 – префикс замены сегмента GS

• 0x0F – префикс дополнительных команд (иногда его не считают за настоящий префикс – в этом случае считается, что опкод команды состоит из двух байт, первый из которых 0x0F)

• 0x66 – префикс переопределения размера операнда (к примеру, вместо регистра eax будет использоваться ax)
• 0x67 – префикс переопределения размера адреса
• 0x9B – префикс ожидания (WAIT)
• 0xF0 – префикс блокировки (LOCK с его помощью реализуется синхронизация многопоточных приложений)
• 0xF2 – префикс повторения команды REPNZ – работа с последовательностями байт (строками)
• 0xF3 – префикс повторения команды REP – работа с последовательностями байт (строками)
Каждый из этих префиксов меняет семантику и (или) структуру машинной инструкции (например, ее длину или выбор мнемоники).
Обязательные префиксы
С появлением расширения SSE часть однобайтных префиксов, а именно 0xf2, 0xf3, 0x66 в некоторых случаях стали иметь смысл части опкода. Появились так называемые обязательные префиксы (англ. mandatory prefixes). Примеры таких инструкций приведены ниже.

Кодировка Инструкция Обязательный префикс
0x0f 0x10 MOVUPS -
0xf2 0x0f 0x10 MOVSD 0xf2
0xf3 0x0f 0x10 MOVSS 0xf3
0x66 0x0f 0x10 MOVUPD 0x66
Не сложно заметить, что кодировки этих инструкций отличаются только префиксом. Опкод у них совпадает – 0x0f 0x10. При этом семантика у этих инструкций различна. Например, MOVSD копирует из одного операнда в другой 64 бита, а MOVUPD – 128 бит.
Префикс REX
В определенный момент появилась необходимость в поддержке 64-битного адресного пространства и расширения числа адресуемых регистров. С этой задачей успешно справились разработчики AMD, добавив префикс, названный REX. Данный префикс также является однобайтными, и имеет вид 0x4*. Его биты используются для расширения уже существующих полей, кодируемых в Mod_R/M байте, а также ширины операнда. На рисунке приведен пример использования REX префикса для адресации регистров.

Стоит отметить несколько особенностей, связанных с использованием этого префикса. Кодировка 0x4*соответствует префиксу только в 64-битном режиме, во всех остальных режимах она соответствует вариантам инструкций INC/DEC. Интересным свойством данного префикса является то, что он должен быть расположен непосредственно перед байтом опкода, в противном случае он игнорируется. Если REXпрефикс используется вместе с инструкцией требующей присутствия другого обязательного префикса, он должен быть расположен между этим префиксом и байтом кода операции.
Префикс VEX
С введением расширения AVX в системе команд IA-32 появился новый префикс, названный VEX. Он уже не однобайтный. Он может состоять либо из двух, либо из трех байт в зависимости от первого байта префикса. 0xc4 и 0xc5 соответственно.

Поля R, X, B, W несут тот же смысл, что и соответствующие поля REX префикса. Поле pp предоставляет функциональность, эквивалентную обязательным SIMD префиксам (например, b01 = 0x66). А поле m-mmmmможет соответствовать целым двум байтам опкода (например, 0b00011 = 0x0f 0x3a). Поле L определяет длину вектора: 0 – 128 бит, 1 – 256 бит.
Использование VEX префикса предоставляет следующие преимущества:

Поддержка до четырех операндов.

Поддержка 128-битных XMM регистров и 256-битных YMM регистров.

Сжатие кодировки уже введенных инструкций.

Удаление необходимости использования REX префикса для адресации регистров общего назначения (R8 – R15), векторных регистров XMM8 – XMM15 (YMM8 – YMM15). VEX позволяет кодировать те же поля, что и REX, и, вдобавок, несколько новых.

Следуют отметить, что использование VEX префикса вместе с некоторыми однобайтными префиксами (0xf0, 0x66, 0xf2, 0xf3, REX) запрещено и приводит к исключению #UD.
Префикс EVEX
Не так давно Intel анонсировал появление нового расширения набора команд с названием AVX3 или AVX512. С появлением этого расширения также появился и новый префикс, получивший название EVEX. Его описание можно найти в Intel Architecture Instruction Set Extensions Programming Reference.

Он представляет собой усовершенствованный вариант VEX префикса, имеет длину уже в 4 байта и начинается с байта 0x62, который во всех режимах, кроме 64-битного соответствует инструкции BOUND, редко используемой в современных программах.

Приведу некоторые, на мой взгляд, интересные особенности EVEX префикса:

Два бита для длины вектора – LL` – необходимые для поддержки векторов размером 128, 256 и 512 бит.

Поддержка адресации новых 512-битных регистров ZMM8 — ZMM31.

Поддержка регистров маски операндов (англ. opmask registers). Поле EVEX.aaa.

EVEX.mm – эквивалент поля VEX.m-mmmm, но занимает два бита вместо пяти.

Заключение

В заключение хочется отметить некоторые причины появления столько сложной и, местами, не логичной системы команд. История развития системы команд Intel IA-32 начинается в 70-х годах прошлого столетия, когда ни о каких 64-битных режимах не было и речи. Кроме Intel существенный вклад в эволюцию IA-32 внесла компания AMD. Много усилий было потрачено на поддержание обратной совместимости между различными моделями процессоров. Множество интересных фактов, связанных с развитием архитектуры IA-32 можно найти в статье A. Fog’a.

Спасибо пользователю Atakua за комментарии к черновикам этой статьи.

P.S. Все иллюстрации взяты из Intel 64 and IA-32 Architectures Software Development Manuals.

Indy_ · 14 дек 2016

Хороший перевод манов. Но вот реальные вопросы:

1. Поведение архитектур при раскодировке префиксов отличается, так на ia число префиксов может быть любой, на amd вроде как генерится ловушка при числе больше 4(не помню точно).
2. Эффективный алгос для определения префиксов(не цикл прохода по строке есно).
3. Определение дефолтной сегментации vs переопределение сегмента(адресация через стек етц).
4. Прочие проблемы, но пока достаточно базовых.

Mikl___ · 14 дек 2016

Правильно ли работает ваш дизассемблер?

автор Евгений Юлюгин aka yulyugin взято здесь

Все началось с прочтения статьи о языке, предназначенном для создания декодеров – GDSL. В этой статье приводятся некоторые уже известные мне примеры, а также новые особенности, о которых я до этого ничего не слышал. Именно о них я сейчас вам и расскажу.

Некоторые инструкции, такие как MULSS, MULSD и MULPD (инструкции векторного умножения) одинаковый опкод 0x0f 0x59, но различные обязательные префиксы (0xf2, 0xf3 и 0x66 соответственно). Появляется вопрос, а что же должно происходить, если в коде инструкции присутствуют одновременно несколько таких префиксов? Наверно, логичнее было бы определять, что это за инструкция, по последнему префиксу. Но это не всегда так! Если последним префиксом является 0xf2 или 0xf3, то он считается обязательным, однако 0x66 является обязательным, только если префиксы 0xf2 и 0xf3 отсутствуют в кодировке данной инструкции. Примеры корректного вывода дизассемблера для этих инструкций можно найти в таблице:

Код инструкции Инструкция Обязательный префикс
66 f3 f2 0f 59 ff MULSD xmm7, xmm7 f2
66 f2 f3 0f 59 ff MULSS xmm7, xmm7 f3
66 0f 59 ff MULPD xmm7, xmm7 66
f2 66 0f 59 ff MULSD xmm7, xmm7 f2
0f 59 ff MULPS xmm7, xmm7 -
На какой-то момент я усомнился в правильности этих утверждений, но, к сожалению, документация дает неоднозначное представление о данном вопросе. После чего было решено провести тесты на реальном процессоре, и оказалось, что он работает именно так. Проверка эта осуществлялась с помощью ассемблерных вставок. Пример одного из тестов приведен ниже:

Код (C):

#include <stdio.h>

int main() {

double a[2] = {2, 2}, b[2] = {0, 0};

__asm__ __volatile__ (

// Copy data from a to xmm7 register

"movupd %1, %%xmm7\n"

//"mulsd %%xmm7, %%xmm7\n"

".byte 0xf2, 0x66, 0x0f, 0x59, 0xff\n"

// Copy data from xmm7 register to b

"movupd %%xmm7, %0\n"

:"=m"(*b)

:"m"(*a)

:

);

printf("%lf %lf\n", b[0], b[1]);

return 0;

}

Скомпилировав и запустив, его вы увидите следующее:

Код (Text):

$ gcc -O0 -Wall mulsd.c

$ ./a.out

4.000000 2.000000

То есть умножился только первый элемент вектора, тогда как второй остался неизменным, что соответствует инструкции MULSD, а не MULPD.
На данном примере было протестировано несколько дизассемблеров, входящих в состав известных пакетов. Немногие из них справились со своей задачей, о чем было незамедлительно сообщено разработчикам данных продуктов. Сводка результатов приведена ниже:

Продукт, версия Результат Сообщенная мною ошибка
Wind River Simics, 4.8 успех -
XED успех -
objdump, 2.23 ошибка 16083
GNU GDB, 7.5 ошибка 16089
nasm, 2.09 ошибка 3392269
ODA, 0.2.0 ошибка Переписка по электронной почте
objconv, 2.31 ошибка Переписка по электронной почте
IDA, 6.4 (Evaluation Version) ошибка Переписка по электронной почте
llvm-objdump, 3.2 ошибка 17697
Следует отметить, что gdb и objdump входят в состав binutils и используют одну и ту же библиотеку для дизассемблирования. Один из разработчиков ODA – Anthony DeRosa – в ответ на мое сообщение об ошибке сказал, что они используют библиотеку libopcodes, входящую в состав binutils. То есть исправление в одном месте должно повлечь за собой корректировку как минимум трех продуктов сразу, но, к сожалению, ни кто из binutils мне пока что не ответил.

А правильно ли работает дизассемблер, которым пользуетесь вы?

Войти или зарегистрироваться

Префиксы в системе команд IA-32

Mikl___ Супермодератор Команда форума

Префиксы в системе команд IA-32

автор Евгений Юлюгин aka yulyugin взято здесь

Однобайтные префиксы

Обязательные префиксы

Префикс REX

Префикс VEX

Префикс EVEX

Заключение

Вложения:

00.png

01.png

02.png

03.png

Indy_ Well-Known Member

Mikl___ Супермодератор Команда форума

Правильно ли работает ваш дизассемблер?

автор Евгений Юлюгин aka yulyugin взято здесь

Кодировка	Инструкция	Обязательный префикс
0x0f 0x10	MOVUPS	-
0xf2 0x0f 0x10	MOVSD	0xf2
0xf3 0x0f 0x10	MOVSS	0xf3
0x66 0x0f 0x10	MOVUPD	0x66

Код инструкции	Инструкция	Обязательный префикс
66 f3 f2 0f 59 ff	MULSD xmm7, xmm7	f2
66 f2 f3 0f 59 ff	MULSS xmm7, xmm7	f3
66 0f 59 ff	MULPD xmm7, xmm7	66
f2 66 0f 59 ff	MULSD xmm7, xmm7	f2
0f 59 ff	MULPS xmm7, xmm7	-

Продукт, версия	Результат	Сообщенная мною ошибка
Wind River Simics, 4.8	успех	-
XED	успех	-
objdump, 2.23	ошибка	16083
GNU GDB, 7.5	ошибка	16089
nasm, 2.09	ошибка	3392269
ODA, 0.2.0	ошибка	Переписка по электронной почте
objconv, 2.31	ошибка	Переписка по электронной почте
IDA, 6.4 (Evaluation Version)	ошибка	Переписка по электронной почте
llvm-objdump, 3.2	ошибка	17697

Войти или зарегистрироваться

Префиксы в системе команд IA-32

Mikl___ Супермодератор Команда форума

Префиксы в системе команд IA-32

автор Евгений Юлюгин aka yulyugin взято здесь

Однобайтные префиксы

Обязательные префиксы

Префикс REX

Префикс VEX

Префикс EVEX

Заключение

Вложения:

00.png

01.png

02.png

03.png

Indy_ Well-Known Member

Mikl___ Супермодератор Команда форума

Правильно ли работает ваш дизассемблер?

автор Евгений Юлюгин aka yulyugin взято здесь

Быстрый поиск