Программирование на языке Assembler в FASM — Архив WASM.RU
Введение В начале было слово... Если точнее то было просто предложение от Kinder-а написать статью посвящённую макросам в FASM. Я согласился попробовать, но рассматривать макросы отдельно от синтаксиса как-то не очень правильно, а синтаксис без примеров разобрать сложно и в результате получилось сочинение о том как писать программы в FASM.
В этом сочинении будут рассмотрены основные моменты отличающие FASM от других компиляторов, правила по которым пишутся макросы и форматы выходных файлов создаваемые FASM-ом. Так же в рамках данного сочинения мы создадим несколько контролов в виде макросов.
Основы.
Данный раздел является вольным
пересказом соответствующего раздела
руководства, поставляемого с
компилятором.Данная статья посвящена использованию макросов в компиляторе FASM. Для начала вопрос: "Что такое макрос?" (поскольку я не могу услышать Ваш ответ прямо сейчас, когда пишу эту статью, отправляйте свои ответы мне по электронной почте, если Ваше мнение отличается от моего мнения).
Макрос - это инструкция препроцессору компилятора развернуть, встретившееся в коде программы, имя макроса (возможно с параметрами) в последовательность строк кода ассемблера с использованием переданных параметров (если таковые заданы).
Далее предлагаю Вам ознакомиться с основными директивами, используемыми внутри определений макросов.
Внутри определений макросов можно использовать инструкции if и else при этом каждая инструкция if должна закрываться инструкцией end if. Пример из руководства, поставляемого вместе с компилятором:
Код (Text):
macro mov op1,op2 { if op1 in <ds,es,fs,gs,ss> & op2 in <cs,ds,es,fs,gs,ss> push op2 pop op1 else mov op1,op2 end if }Этот макрос является расширением инструкции процессора mov. В данном случае если оба операнда макроса являются сегментными регистрами используется связка "push - pop", в любом другом случае используется стандартная инструкция "mov op1,op2". Оператор in позволяет проверить соответствие операнда нескольким значениям в угловых скобках.
Можно ещё более расширить эту инструкцию для пересылки трёх значений второго в первый, а третьего во второй:
Код (Text):
macro mov op1,op2,op3 { if arg3 eq mov op1,op2 else mov op1,op2 mov op2,op3 end if }В данном случае нас интересует инструкция eq, которая позволяет проверить эквивалентен ли операнд какому либо значению, в нашем случае мы проверяем его отсутствие, и если он отсутствует, то подставляется ветвь if иначе подставляется ветвь else.
Директива purge позволяет отменить последнее определение макроса.
Кроме уже изложенного в определение макроса можно передавать заранее неизвестное количество операндов (пар операндов и т.д.), для этого необходимо заключить операнды, количество которых заранее неизвестно, в квадратные скобки. Например для вызова процедур написан макрос STDCALL:
Операндами этого макроса служат один обязательный (proc) и несколько необязательных параметров (arg). Директива reverse сообщает препроцессору, что следующие строки необходимо повторить столько раз, сколько параметров arg передано макросу начиная с последнего параметра. Директива common сообщает препроцессору, что следующие строки необходимо повторить только один раз. Директива forward сообщает препроцессору, что следующие строки необходимо повторить столько раз, сколько параметров arg передано макросу начиная с первого параметра. Действие директив common, forward и reverse заканчивается другой директивой common, forward или re-verse соответственно или закрывающейся фигурной скобкой. Если ни одна из этих директив не встречается в определении макроса, то макрос развернётся для всех параметров начиная с первого. Неизвестное количество параметров можно передать и другому макросу:Код (Text):
macro stdcall proc,[arg]; { reverse push arg common call proc }
Код (Text):
macro invoke proc,[arg] { common if ~ arg eq stdcall [proc],arg else call [proc] end if }В этом примере при выполнении ветви if в макрос stdcall кроме параметра [proc] передаются все полученные параметры arg.
Внутри макроопределения может использоваться оператор #, который может использоваться для составления операторов ассемблера, например условного перехода:
Код (Text):
macro jif op1,cond,op2,label { cmp op1,op2 j#cond label }При выполнении макроса jif ax,ae,10h,exit макрос будет развёрнут в следующую конструкцию:
Код (Text):
cmp ax,10h jae exitТак же этот оператор можно использовать и для составления имён переменных или макросов внутри макроопределений:
Код (Text):
macro ver [name] { name#.mas: times 10 db 0 }Теперь при вызове данного макроса в секции данных
Код (Text):
ver Chif,RabМы будем иметь два массива из 10 байт каждый, с именами Chif.mas и Rab.mas.
Аналогично можно создать и переменные и макросы внутри определения макроса. Однако определить макрос внутри макроса обычным путём:
Код (Text):
Macro mac1 { macro mac2 { ... ... ... } }препроцессор не позволит использовать данную конструкцию, выход в использовании директивы fix она эквивалентна директиве equ, но препроцессор обрабатывает fix позже чем equ, что и позволяет использовать подобную конструкцию:
Код (Text):
Macro mac1 { macro mac2 m_ ... ... ... _m } m_ fix { _m fix }Синтаксис компилятора ФАСМ несколько отличается от синтаксиса других компиляторов, но отличия незначительны и в основном касаются макроязыка.
Средства макроязыка мы рассмотрим ниже, здесь же я хотел бы отметить только то, что передача адреса переменной производится указанием имени переменной без каких либо скобок или префиксов, а её содержимого написанием имени переменной в квадратных скобках.
mov eax,var; записываем в регистр еах адрес переменной var mov eax,[var]; записываем в регистр еах значение переменной var
Структура каркасного приложения на ФАСМ-е В этой части мы рассмотрим, основы
синтаксиса данного компилятора и
рассмотрим каркасные приложения для
основных форматов исполняемых файлов.Итак, что необходимо для работающего приложения?
Во-первых мы должны указать компилятору какого формата должен быть создаваемый файл. Это делается директивой format после, которой следует указание форматов:
- PE формат исполняемых файлов Windows. Далее должно следовать уточнение GUI (графический интерфейс), console (консольное приложение) и native (если Вы знаете, что это такое сообщите мне). Если выбран графический интерфейс, то следует также указать версию графического интерфейса 4.0, а так же зарезервированное слово DLL, если собирается динамическая библиотека.
- MZ формат исполняемых файлов MS DOS.
- COFF или MS COFF (для линковки продуктами Microsoft)для создания объектного файла, который в дальнейшем будет линковаться к другому проекту или к ресурсам.
- ELF формат для создания исполняемых файлов UNIX подобных систем (Linux).
Как Вы наверно поняли, я не знаком с файлами ELF типа и в данной статье мы не будем его рассматривать. Если директива format не указана, компилятор соберёт файл в формате com.
После указания формата выходного файла мы должны указать компилятору точку начала программы. Это делается с помощью директивы entry после которой указывается метка, с которой начинается код программы. Например entry start.
Так же, в случае необходимости, мы должны указать на начало секций данных, кода, импорта, экспорта или ресурсов. Для этого существует директива section, после которой в кавычках следует название секции, далее без скобок тип секции (данные или код) и атрибуты (запись, чтение исполняемый код). Более подробно когда какие атрибуты указывать Вы прочитаете ниже т.к. для разных форматов выходных файлов эти атрибуты отличаются.
Форматы PE исполняемых файлов Windows.
Консольные приложенияКонсольное приложение может использовать все функции API предоставляемые Windows, но работать с такой программой пользователь может только через командную строку.
Вот простой пример консольного приложения:
Код (Text):
format PE console entry start include 'include\kernel.inc' include 'include\macro\stdcall.inc' include 'include\macro\import.inc' section '.data' data readable writeable h4 db Консоль' w1 dd 0 output dd 0 input dd 0 _class db 'FCAPTION',0 podskazka db 'Консоль',0 section '.code' code readable executable start: invoke GetStdHandle,STD_OUTPUT_HANDLE mov [output],eax invoke GetStdHandle,STD_INPUT_HANDLE mov [input],eax invoke WriteConsole,[output],h4,7,w1,0 invoke ReadConsole,[input],_class,2,w1,0 invoke ExitProcess,0 section '.idata' import data readable _library kernel32,'KERNEL32.DLL',\ user32,'USER32.DLL',\ gdi32,'GDI32.DLL',\ advapi32,'ADVAPI32.DLL',\ comctl32,'COMCTL32.DLL',\ comdlg32,'COMDLG32.DLL',\ shell32,'SHELL32.DLL',\ wsock32,'WSOCK32.DLL';,\ include 'C:\FASM135\147\INCLUDE\apia\kernel32.inc' include 'C:\FASM135\147\INCLUDE\apia\user32.inc' include 'C:\FASM135\147\INCLUDE\apia\gdi32.inc' include 'C:\FASM135\147\INCLUDE\apia\advapi32.inc' include 'C:\FASM135\147\INCLUDE\apia\comctl32.inc' include 'C:\FASM135\147\INCLUDE\apia\comdlg32.inc' include 'C:\FASM135\147\INCLUDE\apia\shell32.inc' include 'C:\FASM135\147\INCLUDE\apia\wsock32.inc'В данном примере создаётся три секции: данных, кода и секция импортируемых функций. Секцию импорта я создаю при помощи макроса _library, в стандартной поставке такого макроса нет, но если написать без подчёркивания перед library то всё скомпилируется правильно. Причина проста, я пользуюсь FASM-ом с версии 1.35, а тогда такого макроса еще не было (а сам я ещё не смог бы его написать) и для совместимости с ранее написанными программами я включил два варианта этого макроса. В ранней версии, необходимо было записывать все используемые в приложении функции вручную, теперь же работу по подключению только используемых функций берёт на себя компилятор, хотя за такое удобство приходится платить некоторым увеличением времени компиляции. Более подробно о принципе работы этого и других макросов будет написано в соответствующем разделе ниже.
Название секции импорта ".idata", хотя название можно изменить и это не повлияет на работоспособность программы, т.к. мы указали назначение этой секции import data, далее следует указание атрибутов, в данном случае readable, что означает для чтения и этого достаточно, если Вы не собираетесь менять содержимое этой секции.
Следующей рассмотрим секцию данных. У нас секция данных имеет название ".data", далее следует указание назначения секции data, что означает секцию данных, атрибуты указаны readable writeable, т.е. эта область памяти будет доступна для чтения и записи. Если указать только первый атрибут (readable) при выполнении программы произойдёт ошибка "Программа выполнила недопустимую операцию".
Последней рассмотрим секцию кода, она имеет название ".code" назначение секции code, т.е. исполняемая часть программы, атрибуты readable executable, что означает, что из секции кода мы можем читать данные (под данными может подразумеваться и коды инструкций и определённые в этой секции данные) и можем выполнять содержимое этой секции.
Кроме рассмотренных секций, консольное приложение может иметь секции экспортируемых функций и секцию ресурсов.
Это пожалуй всё, что необходимо знать для начала о консольных приложениях. Да ещё я считаю лишний раз напомнить, что хоть консольное приложение и напоминает внешне программы DOS-а, использование прерываний в нём не допускается т.к. это всё же приложение Windows, естественно выполняться такое приложение может только в Windows.
Графическое приложение Графические приложения Windows это оконные приложения, такие как Word, Excel, Notepad и т.д.
В отличии от консольных приложений, GUI приложения должны содержать как минимум одну процедуру обработки сообщений, приходящих к окну. Вот простой пример оконного приложения:
Код (Text):
format PE GUI 4.0 entry start include 'include\kernel.inc' include 'include\user.inc' include 'include\macro\stdcall.inc' include 'include\macro\import.inc' include 'include\macro\resource.inc' section '.data' data readable writeable Avtor db 'Автор:Пороткин Алексей Сергеевич',0 Progr db 'Программа построения графиков',0 MyMessage db 'Отклик',0 hinstance dd 0 h4 db 'Сообщение',0 w1 dd 0 msg MSG wc WNDCLASS pt dd 0 hDC dd 0 ws equ WS_VISIBLE+WS_CAPTION+WS_MINIMIZEBOX+WS_SYSMENU _class db 'FCAPTION',0 podskazka db 'Графическое приложение',0 section '.code' code readable executable start: invoke GetModuleHandle,0 mov [hinstance],eax invoke LoadIcon,eax,17 mov [wc.hIcon],eax invoke LoadCursor,0,IDC_ARROW mov [wc.hCursor],eax mov [wc.style],0 mov [wc.lpfnWndProc],WindowProc mov [wc.cbClsExtra],0 mov [wc.cbWndExtra],0 mov eax,[hinstance] mov [wc.hInstance],eax mov [wc.hbrBackground],6;COLOR_BTNFACE+1 mov [wc.lpszMenuName],0 mov [wc.lpszClassName],_class invoke RegisterClass,wc invoke CreateWindowEx,0,_class,podskazka,ws,10,10,680,450,NULL,NULL,[hinstance],NULL msg_loop: invoke GetMessage,msg,NULL,0,0 or eax,eax jz end_loop invoke TranslateMessage,msg invoke DispatchMessage,msg jmp msg_loop end_loop: invoke ExitProcess,[msg.wParam] ;include 'include\macro\lib.asm' proc WindowProc, hwnd,wmsg,wparam,lparam enter push ebx esi edi cmp [wmsg],WM_DESTROY je wmdestroy cmp [wmsg],WM_CREATE je wmcreate defwndproc: invoke DefWindowProc,[hwnd],[wmsg],[wparam],[lparam] jmp finish wmcreate: jmp ext wmdestroy: invoke PostQuitMessage,0 ext: xor eax,eax finish: pop edi esi ebx return section '.idata' import data readable writeable library kernel,'KERNEL32.DLL',\ user,'USER32.DLL' ;shell,'SHELL32.DLL',\ ;gdi,'gdi32.dll' kernel: import GetModuleHandle,'GetModuleHandleA',\ ExitProcess,'ExitProcess',lstrcpy,'lstrcpyA',\ FindFirstChangeNotification,'FindFirstChangeNotificationA',\ FindNextChangeNotification,'FindNextChangeNotification',\ FindCloseChangeNotification,'FindCloseChangeNotification' user: import RegisterClass,'RegisterClassA',\ CreateWindowEx,'CreateWindowExA',\ DefWindowProc,'DefWindowProcA',\ SetWindowLong,'SetWindowLongA',\ RedrawWindow,'RedrawWindow',\ GetMessage,'GetMessageA',\ MessageBox,'MessageBoxA',\ TranslateMessage,'TranslateMessage',\ DispatchMessage,'DispatchMessageA',\ SendMessage,'SendMessageA',\ LoadCursor,'LoadCursorA',\ LoadIcon,'LoadIconA',\ LoadMenu,'LoadMenuA',\ SetMenu,'SetMenu',\ InsertMenu,'InsertMenuA',\ CreateMenu,'CreateMenu',\ DrawMenuBar,'DrawMenuBar',\ PostQuitMessage,'PostQuitMessage',\ FindWindow,'FindWindowA',\ FindWindowEx,'FindWindowExA',\ LoadImageA,'LoadImageA',\ CreatePopupMenu,'CreatePopupMenu',\ AppendMenu,'AppendMenuA',\ DestroyMenu,'DestroyMenu',\ GetCursorPos,'GetCursorPos',\ SetForegroundWindow,'SetForegroundWindow',\ TrackPopupMenu,'TrackPopupMenu',\ PostMessage,'PostMessageA',\ DestroyWindow,'DestroyWindow',\ ShowWindow,'ShowWindow',GetDC,'GetDC' section '.rsrc' resource data readable directory RT_ICON,icons,\ RT_GROUP_ICON,group_icons icons: resource 1,LANG_NEUTRAL,icon_data group_icons: resource 17,LANG_NEUTRAL,main_icon icon main_icon,icon_data,'mp\lv\lv.ico'Так же, как и в примере с консольным приложением, в первой строке указана директива format PE, но вместо console, как в предыдущем примере, дано указание GUI 4.0 компилятору собирать приложение с графическим интерфейсом версии 4.0.
Приложение из нашего примера ничего полезного не делает, оно просто создаёт окно, которое реагирует только на нажатие двух системных кнопок в верхнем правом углу окна "Свернуть" и "Закрыть". Приложение содержит секции данных, кода, импорта и ресурсов. После указания точки входа в программу entry start подключаются файлы содержащие макросы и определения констант и структур Windows. Затем следует секция данных, определение которой дано в предыдущем разделе, и секция кода. В секции кода мы получаем хендл нашего модуля (GetModuleHandle), загружаем иконку (LoadIcon), определённую в секции ресурсов, загружаем стандартный курсор Windows (LoadCursor) и заполняем структуру wc для дальнейшей регистрации класса нашего окна (RegisterClass). После регистрации класса окна мы создаём окно зарегистрированного класса (CreateWindowEx). В структуре wc имеется член .lpfnWndProc, в который мы записываем адрес начала процедуры обработки событий окна WindowProc. Далее следует цикл обработки сообщений, посылаемых окну системой Windows.
Процедура обработки сообщений получает от Windows четыре параметра:
proc WindowProc, hwnd, wmsg, wparam, lparam
где:
hwnd - хендл нашего окна
wmsg - код сообщения, которое Windows послало нашему окну
wparam и lparam - уточняющие параметры посланного сообщения.proc это не директива компилятора, а макрос содержащий, часть пролога процедуры. Он определён следующим образом:
Код (Text):
macro proc name,[arg] { common name: virtual at ebp+8 if ~ arg eq forward local ..arg ..arg dd ? arg equ ..arg common end if ..ret = $ - (ebp+8) end virtual local ..dynamic_data,..dynamic_size dynamic_data equ ..dynamic_data dynamic_size equ ..dynamic_size virtual at ebp - dynamic_size dynamic_data: }Таким образом следующая строка proc Win,param будет развёрнута в следующую конструкцию:
Код (Text):
Win: virtual at ebp+8 local ..param ..param dd ? param equ ..param ..ret = $ - (ebp+8) end virtual local ..dynamic_data,..dynamic_size dynamic_data equ ..dynamic_data dynamic_size equ ..dynamic_size virtual at ebp - dynamic_size dynamic_data: }Более подробно это означает, что мы определяем метку Win, которая означает начало процедуры. В следующей строке записана директива virtual at ebp+8, которая должна заканчиваться директивой end virtual. Внутри этого определения помещаются переменные, которые будут размещаться с адреса указанного после at, в нашем примере это ebp+8. Это означает, что в нашем примере запись "mov param,eax" будет заменена на "mov [ebp+8],eax". Если бы в определении процедуры было две или более переменных, то адрес каждой последующей переменной увеличивался бы на размер предыдущей переменной. Таким образом:
Код (Text):
virtual at ebp+8 param1 dd ? param2 db ? param3 dd ? end virtualопределит три переменные с адресами
Код (Text):
param1 = ebp+8+0, param2 = ebp+8+4, param2 = ebp+8+5.У некоторых читателей может возникнуть вопрос: "А зачем все эти пляски?". Ответ прост: регистр ebp указывает на вершину стека и все переменные, передаваемые в процедуру, находятся выше (в смысле в памяти с адресами больше чем вершина стека т.к. вершина стека сдвигается вниз когда в стек помещаются данные и вверх, когда данные из стека изымаются) текущей вершины стека.
Первой, в определении переменных внутри virtual - end virtual записана директива local, которая указывает компилятору, что следующие за ней через запятую метки, локальны в данном макросе.
Последней, внутри описания виртуальных переменных, следует определение макропеременной ..ret = $ - (ebp+8), которая фактически содержит количество переданных процедуре байт параметров. Она используется при написании эпилога процедуры для очистки стека при возврате управления инструкции, следующей за вызовом данной процедуры.
После определения виртуальных переменных, передаваемых процедуре в качестве параметров, определяются локальные макропеременные, которые используются во второй части пролога процедуры. Я уже несколько раз использовал термин - макропеременная. Макропеременная отличается от переменных, используемых в программе, тем, что она существует только во время компиляции и используется как константа, которая может иметь разные значения в разных частях программы.
После определения макропеременных начинается блок определения виртуальных переменных, однако переменных в этом макросе нет. После макроса proc необходимо ставить макрос enter, который содержит заключительную часть пролога, а между ними могут располагаться локальные переменные. Для того, что бы имена переменных были локальными перед ними ставится точка. Например .param. Макрос enter определён следующим образом:
Таким образом dynamic_size - это размер памяти отведённой под локальные переменные. Последняя инструкция, в прологе процедуры, enter dynamic_size,0. Это единственная строка, которая попадёт в исполняемый код программы. Завершаться процедура должна макросом return, который определён следующим образом:Код (Text):
macro enter { dynamic_size = $ - dynamic_data end virtual enter dynamic_size,0 }
Код (Text):
macro return { leave ret ..ret }Полагаю здесь не должно быть сложностей с пониманием макроса.
Процедура должна правильно обрабатывать поступившие сообщения. Те сообщения, которые мы хотим обработать сами, выделяются в первых строках процедуры и управление передаётся на те участки кода, которые должны производить необходимые действия, а те сообщения, которые нам нет необходимости обрабатывать, мы доверяем обработать системе Windows (Def-WindowProc).
Хочу обратить Ваше внимание на то, что в данной программе используются глобальные метки (wmdestroy, wmcreate, defwndproc), что не очень удобно в программах содержащих несколько процедур (большинство оконных процедур обрабатывают одни и те же сообщения), поэтому рекомендуется внутри процедур использовать локальные метки (.wmdestroy, .wmcreate, .defwndproc).
Теперь пришло время посмотреть на секцию импорта. Она отличается от рассмотренной в предыдущем разделе здесь мы используем макрос library, который определён следующим образом:
Код (Text):
macro library [label,string] { forward local _label dd 0,0,0,rva _label,rva label common dd 0,0,0,0,0 forward _label db string,0 }Для того, чтобы было более понятно вспомним, как в нашем примере используется этот макрос:
Код (Text):
library kernel,'KERNEL32.DLL',\ user,'USER32.DLL'Таким образом, макрос library создаёт заголовок таблицы импорта, вначале записывая смещение названия библиотеки DLL, а затем смещение, с которого начинаются имена импортируемых функций.
Далее следуют макросы import, определённые следующим образом:
Код (Text):
macro import [label,string] { forward local _label label dd rva _label common dd 0 forward _label dw 0 db string,0 }Он создаёт тело таблицы импорта для каждой из импортируемых библиотек.
Вначале создавая таблицу смещений имён импортируемых функций, а затем записывая имена импортируемых функций. Более подробно о структуре PE-файла Вы должны прочитать в соответствующей литературе (например в туториалах, которые написал Iczelion).
После таблицы импорта создаётся таблица ресурсов:
Код (Text):
section '.rsrc' resource data readable directory RT_ICON,icons,\ RT_GROUP_ICON,group_icons icons: resource 1,LANG_NEUTRAL,icon_data group_icons: resource 17,LANG_NEUTRAL,main_icon icon main_icon,icon_data,'mp\lv\lv.ico'В нашем примере мы используем только одну иконку.
Динамические библиотеки (DLL) Последним в данном разделе рассмотрим простую динамическую библиотеку.
Динамическая библиотека - это приложение GUI, который может содержать как исполняемый код, так и ресурсы. Это приложение не предназначено для самостоятельного запуска, оно используется другими приложениями для хранения часто используемых процедур, шрифтов и многого другого.
Мы рассмотрим создание динамической библиотеки на примере процедуры, возвращающей строку, содержащую текущую дату. Мы создадим два модуля один файл динамической библиотеки (dll2.dll) и файл использующий созданную нами библиотеку (usedll.exe).
Вот файл динамической библиотеки:
Код (Text):
format PE GUI 4.0 DLL entry DllEntryPoint include 'include\kernel.inc' include 'include\user.inc' include 'include\macro\stdcall.inc' include 'include\macro\import.inc' include 'c:\fasm135\include\lib\strings.mac' include 'include\macro\export.inc' section '.data' data readable writeable _outs: times 60 db 0 Date SYSTEMTIME day db 'День:',0 mon db ' Месяц:',0 year db ' Год:',0 h4: times 20 db 0 DllState db 'Состояние библиотеки DLL',0 DllStart db 'Загружена',0 DllStop db 'Выгружена',0 bf: times 20 db 0 section '.code' code readable executable proc DllEntryPoint, hinstDLL,fdwReason,lpvReserved enter cmp [fdwReason],DLL_PROCESS_ATTACH je .start cmp [fdwReason],DLL_PROCESS_DETACH je .stop jmp .stp .start: invoke MessageBox,0,DllStart,DllState,MB_OK jmp .stp .stop: invoke MessageBox,0,DllStop,DllState,MB_OK jmp .stp .stp: mov eax,TRUE return proc Wind enter push ebx esi edi invoke GetLocalTime,Date mov ebx,_outs StringCopyHTML ebx,day add ebx,eax xor eax,eax mov ax,[Date.wDay] stdcall IntToString,h4,eax StringCopyHTML ebx,h4 add ebx,eax StringCopyHTML ebx,mon add ebx,eax xor eax,eax mov ax,[Date.wMonth] stdcall IntToString,h4,eax StringCopyHTML ebx,h4 add ebx,eax StringCopyHTML ebx,year add ebx,eax xor eax,eax mov ax,[Date.wYear] stdcall IntToString,h4,eax StringCopyHTML ebx,h4 mov eax,_outs pop edi esi ebx return proc IntToString,lpOutBuf,var len dd 0 enter push ebx esi edx ecx esi ;jmp .ex cmp [var],0 jne .norr mov eax,[lpOutBuf] mov dx,030h mov [eax],dx jmp .ex .norr: mov eax,10 mov [len],eax xor eax,eax xor edx,edx xor ecx,ecx mov esi,bf mov eax,[var] cmp eax,0 jne .ll mov eax,48 mov [esi],al inc esi jmp .ext .ll: div [len] add dl,48 mov [esi],dl inc esi inc ecx xor edx,edx cmp eax,0 jne .ll .ext: mov [esi],dl mov eax,[lpOutBuf] cmp ecx,0 je .ex .l: dec esi mov dl,[esi] mov [eax],dl inc eax dec ecx cmp ecx,0 jne .l mov dl,0 mov [eax],dl .ex: pop esi ecx edx esi ebx return section '.idata' import data readable writeable _library kernel32,'KERNEL32.DLL',\ user32,'USER32.DLL';,\ include 'C:\FASM135\147\INCLUDE\apia\kernel32.inc' include 'C:\FASM135\147\INCLUDE\apia\user32.inc' section '.edata' export data readable export 'dll2.dll',Wind,'Wind' section '.reloc' fixups data discardableПервые строки format PE GUI 4.0 DLL и entry DllEntryPoint указывают компилятору создать РЕ-файл динамической библиотеки с точкой входа на метке DllEntryPoint.
Как Вы могли заметить динамическая библиотека практически ни чем не отличается от обычной программы Windows, кроме того, что входная процедура вызывается системой в четырёх случаях:
- Когда динамическая библиотека загружается в адресное пространство процесса (параметр fdwReason = DLL_PROCESS_ATTACH = 1);
- Когда динамическая библиотека выгружается из адресного пространства процесса (параметр fdwReason = DLL_PROCESS_ DETACH = 0);
- Когда создается новый поток в рамках динамической библиотеки (параметр fdwReason = DLL_ THREAD_ATTACН = 2);
- Когда разрушается (прекращается) поток в рамках динамической библиотеки (параметр fdwReason = DLL_ THREAD_DETACH = 3).
В обработке стартовой процедуры мы определяем значение параметра fdwReason и если динамическая библиотека была загружена или выгружена выдаём соответствующее сообщение.
В конце файла мы создаём секцию экспорта нашей библиотеки:
Код (Text):
section '.edata' export data readable export 'dll2.dll',Wind,'Wind' section '.reloc' fixups data discardableВ таблице мы задаём имя файла динамической библиотеки и имена экспортируемых процедур.
Макрос export определён следующим образом:
Код (Text):
macro export dllname,[label,string] { common local module,addresses,names,ordinal,count count = 0 forward count = count+1 common dd 0,0,0,rva module,1 dd count,count,rva addresses,rva names,rva ordinal addresses: forward dd rva label common names: forward local name dd rva name common ordinal: count = 0 forward dw count count = count+1 common module db dllname,0 forward name db string,0 }Сперва, объявляются локальные метки и подсчитывается количество экспортируемых процедур:
Код (Text):
common local module,addresses,names,ordinal,count count = 0 forward count = count+1 commonЗатем заносится смещение RVA имени библиотеки:
Код (Text):
dd 0,0,0,rva module,1Следующая строка заносит общее количество экспортируемых функций, количество функций экспортируемых по имени (при использовании этого макроса все функции экспортируются по имени), смещение начала массива смещений функций, смещение начала массива смещений имен экспортируемых функций и смещение массива смещений ординалов функций.
Код (Text):
dd count,count,rva addresses,rva names,rva ordinalДалее объявляется метка начала массива смещений экспортируемых функций и создаётся массив их смещения:
Код (Text):
addresses: forward dd rva labelСледом объявляется метка начала массива смещений имён экспортируемых функций и создаётся сам массив:
Код (Text):
common names: forward local name dd rva nameЗатем объявляется метка начала массива смещений ординалов функций и создаётся массив ординалов экспортируемых функций:
Код (Text):
common ordinal: count = 0 forward dw count count = count+1Ну и в конце макроса записывается имя динамической библиотеки и создаётся массив имен экспортируемых функций:
Код (Text):
common module db dllname,0 forward name db string,0Для более подробного ознакомления со структурой секции экспорта необходимо читать специальную литературу по структуре РЕ - файлов.
Теперь давайте посмотрим, на программу вызывающую нашу динамическую библиотеку:
Код (Text):
format PE GUI 4.0 entry start include 'include\kernel.inc' include 'include\user.inc' include 'include\macro\stdcall.inc' include 'include\macro\import.inc' section '.data' data readable writeable Avtor db 'Автор:Пороткин Алексей Сергеевич',0 podskazka db 'Функция Wind возвратила указатель на строку:',0 section '.code' code readable executable start: invoke Wind invoke MessageBox,0,eax,podskazka,MB_OK invoke ExitProcess,0 section '.idata' import data readable writeable library kernel,'KERNEL32.DLL',\ user,'USER32.DLL',\ MyDll,'C:\FASM135\mp\Dll2\Dll2.DLL' kernel: import ExitProcess,'ExitProcess' user: import MessageBox,'MessageBoxA' MyDll: import Wind,'Wind'Обычное графическое приложение не имеющее своего окна и ресурсов размером 2 кБ. Импортирует только три функции две предоставляемые системой Windows и одна написанной нами динамической библиотекой. Как видите подключение созданной нами динамической библиотеки, ничем не отличается от подключения стандартных библиотек Windows. В этом и заключается вся прелесть использования ФАСМ-а, он не берёт на себя слишком много, что в купе с гибким макроязыком позволяет сделать очень многое максимально просто.
Формат исполняемых файлов MS COFF (obj - файлы) Использование obj-файлов в ФАСМ, лично мне, не кажется жизненно необходимым, однако использование этого формата возможно понадобится при создании проектов на С/С++. Именно на таком примере мы и рассмотрим формат файлов MS COFF.
Для примера напишем программу, выводящую МессаджБокс с текущей датой. Модуль на ассемблере будет составлять строку символов, а модуль на С++ будет выводить эту строку в МессаджБокс.
Вот модуль на ассемблере:
Код (Text):
format MS COFF ;public _WinMainCRTStartup public _outs public ?Wind@@YAPADXZ extrn '__imp__GetLocalTime@4' as GetLocalTime:dword include 'include\kernel.inc' include 'include\macro\stdcall.inc' include 'c:\fasm135\include\lib\strings.mac' include 'c:\fasm135\include\lib\strings.asm' section '.text' code readable executable ; _WinMainCRTStartup: proc ?Wind@@YAPADXZ enter push ebx esi edi invoke GetLocalTime,Date mov ebx,_outs StringCopyHTML ebx,day add ebx,eax xor eax,eax mov ax,[Date.wDay] stdcall IntToString,h4,eax StringCopyHTML ebx,h4 add ebx,eax StringCopyHTML ebx,mon add ebx,eax xor eax,eax mov ax,[Date.wMonth] stdcall IntToString,h4,eax StringCopyHTML ebx,h4 add ebx,eax StringCopyHTML ebx,year add ebx,eax xor eax,eax mov ax,[Date.wYear] stdcall IntToString,h4,eax StringCopyHTML ebx,h4 add ebx,eax mov eax,_outs pop edi esi ebx return section '.data' data readable writeable h4 db 'Сообщение',0 Date SYSTEMTIME day db 'День:',0 mon db ' Месяц:',0 year db ' Год:',0 _outs: times 30 db 0Обратите внимание на строку 2, где закомментировано определение точки входа в программу (_WinMainCRTStartup)если эту строку раскомментировать, то точка входа в программу будет именно в модуле на ассемблере. Результат работы функции записывается в переменную _outs и адрес (указатель на строку) возвращаем в регистре еах. В этом модуле используются макросы копирования строки в строку (StringCopyHTML ebx,day). Этот макрос не входит в поставку компилятора и содержится в файлах strings.mac и strings.asm он просто копирует строку (не включая нулевой символ), указатель на которую передаётся вторым параметром, в строку, указатель которой передаётся вторым параметром, после его выполнения в регистре еах количество скопированных символов. Эта процедура выдаёт строку типа: "День: 28 Месяц: 10 Год:2003". Для использования объектного модуля созданного на ассемблере необходимо в проект на С++ добавить созданный нами объектный файл (Project->Add to project->Files. . . в появившемся окне необходимо выбрать тип файлов obj и указать используемый файл). Теперь рассмотрим текст программы на MS Visual C++ 5.0:
Код (Text):
#include «windows.h» extern char * __cdecl Wind(void); LPSTR cmsk,dat; int PASCAL WinMain(HANDLE hInstance,HANDLE hPrevInstance,LPSTR lpszCmdParam,int nCmdShow) { dat=Wind(); MessageBox(0,dat,dat,MB_OK); }Здесь ничего сложного: подключаем файл «windows.h», затем объявляем внешнюю процедуру, возвращающую указатель на строку символов с нулём в конце, объявляем переменную dat, как указатель на строку символов, и наконец функция WinMain в которой вызываем нашу функцию (Wind) на ассемблере и выводим результат в мессаджбокс. Внимательный читатель скажет: "Стоп, но в модуле на ассемблере функцию мы объявили как ?Wind@@YAPADXZ, а в модуле на С++ вызываем Wind". Всё правильно. Просто MS Visual C++ 5.0, к объявленным внешним (находящимся в скомпилированных модулях) процедурам добавляет дополнительные символы, для контроля соответствия типов передаваемых результатов из процедуры и переменных в процедуру. Вот краткая структура имени функций формируемых MS Visual C++:
Префикс Объявленное имя переменной Разделитель Тип вызова процедуры Тип результата Тип параметров Постфикс ? Wind @@Y A PAD X Z Причём постфикс изменяется в зависимости от наличия передаваемых в функцию параметров. Если параметры передаются, то постфикс "@Z", а если параметры не передаются то просто "Z".
Типы вызова процедуры следующие:
__cdecl A __fastcall I __stdcall G Типы результата и передаваемых переменных имеют одинаковые обозначения:
Тип результата Размер Обозначение char 1 D unsigned char 1 E short 2 F unsigned short 2 G enum 2 ?AW4__unnamed@@ long 4 J unsigned long 4 K int 4 H unsigned int 4 I float 4 M double 8 N long double 10 O bool 1 _N Причём если передаётся (получается) не параметр, а его адрес (например char *) то перед обозначением переменной добавляется PA. Если параметры, получаемые из процедуры или передаваемые в процедуру, отсутствуют, вместо них ставится X.
Читатель может сказать: "Это как же нужно мозг морщить, чтобы всё запомнить и не перепутать ничего при составлении имени процедуры?". Такая работа имеет основное свойство: она не особо интеллектуальна, но муторна и действия при её решении вполне укладываются в рамках алгоритма. Отсюда вывод: компьютер на то и создан, что бы выполнять подобные задачи так пусть сам, и добавляет все эти префиксы, постфиксы и т.п. Напишем макрос, который будет объявлять процедуру составляя её имя из имени которое мы ему передаём и добавляя к нему все необходимые префиксы.
Использовать переменные длиннее 4 байт мы не будем, но думаю Вы сами сможете модернизировать макросы под свои нужды если понадобится.
Для начала мы должны определить символьные константы, соответствующие типам вызова процедуры и типам получаемых и возвращаемых параметров:
Код (Text):
; константы типов вызовов процедур __cdecl fix A __fastcall fix I __stdcall fix G ; константы типов переменных void fix X char$ fix PAD char fix D unsigned_char$ fix PAE unsigned_char fix E short$ fix PAF short fix F unsigned_short$ fix PAG unsigned_short fix G long$ fix PAJ long fix J unsigned_long$ fix PAK unsigned_long fix K int$ fix PAH int fix H unsigned_int$ fix PAI unsigned_int fix I float$ fix PAM float fix MДалее следует определение макроса:
Код (Text):
macro exp_proc calltype,returns,name,[arg,type] { dr fix forward dr fix dr#type common if type eq void public ?#name#@@Y#calltype#returns#dr#Z ?#name#@@Y#calltype#returns#dr#Z: else public ?#name#@@Y#calltype#returns#dr#@Z ?#name#@@Y#calltype#returns#dr#@Z: end if common virtual at ebp+8 if ~ arg eq forward local ..arg ..arg dd ? arg equ ..arg common end if ..ret = $ - (ebp+8) end virtual local ..dynamic_data,..dynamic_size dynamic_data equ ..dynamic_data dynamic_size equ ..dynamic_size virtual at ebp - dynamic_size dynamic_data: }В первой строке мы очищаем временную символьную константу, далее следует указание препроцессору обработать строку "dr fix dr#type" для всех значений параметров type начиная с первого. Эта строчка, просто создаёт константу содержащую все символы соответствующие всем получаемым процедурой параметрам. Например если в процедуру передаётся два параметра типа int, то dr будет эквивалентно HH. Далее следует указание препроцессору следующие строки обработать только один раз (common) в этих строках мы делаем видимой из других модулей программы метку (название) нашей процедуры и собственно следует содержимое макроса proc, рассмотренного ранее.
Полагаю, этот макрос не должен вызвать затруднений. Сложности в понимании может вызвать только строка "?#name#@@Y#calltype#returns#dr#@Z", объясню её более подробно. Сперва стоит знак вопроса (посмотрите табличку со структурой имени процедуры), после которого, значок номера (#), он говорит препроцессору, что далее следует символьная константа, которую следует склеить в одну метку с предыдущим текстом. Если константы с указанным именем не существует, то она включается, как есть. Рассмотрим последовательность действий препроцессора. Метка состоит из вопросительного знака, затем (без разделителей) добавляется, передаваемая макросу переменная name, после неё добавляется текст @@Y,после текста добавляется передаваемая макросу переменная calltype, затем переменная returns, потом составленная нами константа dr, и наконец постфикс @Z (или просто Z, если в процедуру не передаются параметры).
Всё. Макрос создан. Однако это ещё не всё. С таким определением процедуры не всегда можно использовать стандартные макросы enter и return т.к. тип вызова __cdecl предполагает, что стек после завершения работы процедуры будет очищаться вызывающей процедурой т.е. модулем написанным на С++, а стандартный макрос return сам очищает стек. Вот макрос, содержащий эпилог процедуры для типа вызова __cdecl:
Код (Text):
macro cdecl_ret { sub ebp,dynamic_size mov esp,ebp pop ebp ret }Но не только эпилог нужно изменить, но и пролог тоже:
Код (Text):
macro cdecl_enter { dynamic_size = $ - dynamic_data end virtual push ebp mov ebp,esp add ebp,dynamic_size }Полагаю эти два коротеньких макроса не вызовут затруднений.
Ну и пример использования данных макросов:
Код (Text):
exp_proc __cdecl,char$,Wi,first,int,second,int cdecl_enter push ebx esi edi mov eax,[first] stdcall IntToString, _outs,eax mov eax,_outs pop edi esi ebx cdecl_retФункция IntToString преобразует 32-х битное без знаковое число (второй параметр) в строку (адрес строки передаётся первым параметром).
Модуль на С++ будет выглядеть следующим образом:
Код (Text):
#include <windows.h> extern char * __cdecl Wind(void); extern char * __cdecl Wi(int c,int b); LPSTR cmsk,dat; int PASCAL WinMain(HANDLE hInstance,HANDLE hPrevInstance,LPSTR lpszCmdParam,int nCmdShow) { dat=Wi(12,30); MessageBox(0,dat,dat,MB_OK); Wind(); MessageBox(0,dat,dat,MB_OK); }Думаю больше пояснений не нужно.
Формат исполняемых файлов MS DOS
Формат исполняемых файлов MZПрограммирование под ДОС в ФАСМ в принципе почти ничем не отличается от программирования под ДОС в любом другом компиляторе.
Вот простейший пример программы:
Код (Text):
format MZ push cs pop ds mov ah,9 mov dx,hello int 21h mov ax,4C00h int 21h hello db 'Hello world!',24hКак видите ничего сложного.
Формат исполняемых файлов СОМ Если директива format не указана создаются файлы формата *.сом. Вот пример:
Код (Text):
org 100h ;Указание загрузить программу начиная с адреса 100h use16 ;Создавать 16-ти битный код mov ah,9 mov dx,hello int 21h int 20h hello db 13,10,'Привет всем$'Думаю здесь всё понятно. © pas
Программирование на языке Assembler в FASM
Дата публикации 6 янв 2004