Всем привет. Бывают ситуации когда в VB нужно использовать ассемблер. Обычно для этого используют предварительно скомпилированный код размещенный в памяти и запускают его одним из миллиона способов. Очевидным недостатком этого метода является то, что любая модификация ассемблерного кода требует изменения в процедурах размещения кода в памяти. К тому же это является довольно медленной процедурой. Я написал Add-in, который делает вышеописанные процедуры автоматически, а также после компиляции никакие дополнительные действия по размещению кода не выполняются - ассемблерный код влинковывается в EXE. Ассемблерный код работает и в IDE и в скомпилированном (только Native!) коде. Как этим пользоваться? Для начала нужно установить Add-in (установщик доступен по ссылке ниже). После установки нужно запустить его из VB (Add-Ins -> Add-in Manager -> Inline assembler). После этого в меню добавится одноименный пункт. Если проект еще не использовал функционал Add-in'а то при первой активации добавится стандартный модуль, в который нужно будет добавить прототипы ассемблерных функций для VB6. Сам модуль можно переименовывать, добавлять процедуры/функции, но размещать в них какой-либо функционал запрещено. После создания модуля можно уже открыть сам редактор ассемблерного кода. В нем доступен раскрывающийся список с именами функций, определенных в добавленном модуле. Для каждой функции можно переопределить код используя синтаксис ассемблера NASM, однако если кода нет, то функция не модифицируется (т.е. получается обычный вызов пустой функции). С каждым проектом (если использовался функционал Add-in'а) связывается еще один файл с расширением *ia в папке с файлом проекта, в котором хранятся ассемблерные процедуры для проекта. Add-in работает "прозрачно", т.е. если Add-in отключен, то проект также будет работать и компилироваться, просто "функции-пустышки" будут работать как обычные. Файл *ia не является жизненно-необходимым для работы проекта, если его не будет, то соответственно "функции-пустышки" останутся нетронутыми. Давайте посмотрим работу Add-in'а на простом примере. К примеру нам необходимо сложить два Integer-массива без переполнения, т.е. если результат сложения больше 32767 он и останется 32767, а если меньше -32768 он останется -32768. К тому же нам нужно сделать это как можно быстрее. Для этого очень хорошо подходит расширение MMX, в нем есть инструкции для работы с векторными данными с насыщением. Перейдем к реализации. Создадим новый проект, откроем Add-in. Это добавит новый модуль, переименуем его в modInlineAsm. Теперь определим прототип функции: Код (Visual Basic): Public Function MMXAdd( _ ByRef dest As Integer, _ ByRef src As Integer, _ ByVal count As Long) As Long End Function Первым параметром передаем первый элемент массива, он же результирующий; вторым параметром первый элемент второго массива; наконец третьим параметром передаем количество элементов. Кстати размер массивов должен быть кратен 8 байтам, т.к. мы будем использовать векторные инструкции которые одновременно работают с 8-ю байтами. Теперь определим процедуру в форме, которая будет вызывать эту функцию: Код (Visual Basic): Private Sub Form_Load() Dim src() As Integer Dim dst() As Integer Dim size As Long Dim index As Long size = 1024 ReDim src(size - 1) ReDim dst(size - 1) For index = 0 To size - 1 ' // Fill arrays with sine src(index) = Sin(index / 40) * 20000 dst(index) = Sin(index / 23) * 20000 Next ' // Add with saturation MMXAdd dst(0), src(0), size '// Draw result AutoRedraw = True Scale (0, 32767)-(index, -32768) For index = 0 To size - 1 If index Then Me.Line -(index, dst(index)) Else Me.PSet (index, dst(index)) End If Next End Sub Как видно здесь просто заполняются 2 массива синусоидой, а потом мы их складываем с помощью нашей функции, и выводим результат на форму в виде графика. Теперь нам нужно переопределить процедуру, для этого активируем Add-in. Откроется окно с редактором кода. В нем мы выбираем нашу функцию и добавляем следующий ассемблерный код: Код (ASM): BITS 32 ; Addition of two arrays using saturation ; Size of arrays should be a multiple of 8 push EBP mov EBP, ESP push EBX push ESI push EDI mov ESI,DWORD [EBP+0x8] mov EDI,DWORD [EBP+0x0C] mov ECX,DWORD [EBP+0x10] shr ECX,2 test ECX,ECX je EXIT_PROC emms ; Initialize MMX CYCLE: movq MM0,QWORD [EDI] movq MM1,QWORD [ESI] paddsw MM1,MM0 movq QWORD [ESI],MM1 add ESI,0x8 add EDI,0x8 loop CYCLE emms EXIT_PROC: pop EDI pop ESI pop EBX mov esp, ebp pop ebp ret 0x0c Здесь все просто, если знать инструкции. Самая главная paddsw складывает два четырехмерных вектора 16-битных значений со знаком за одну операцию. Теперь сохраняем проект и запускаем: Как видно из скриншота, две синусоиды сложились причем с насыщением, это можно заметить по пикам. Теперь давайте попробуем скомпилировать EXE файл и посмотреть что у нас вызывается и во что компилируется: Как видим код уже находится внутри EXE, без всяких выделений буферов и т.п. ненужных вещей. Как это работает? На самом деле все довольно просто. В самом начале ставятся обработчики на ключевые события вроде компиляции, запуска кода, закрытия/сохранения проекта и т.п. При запуске из IDE компилируются все коды заданные пользователем, а также вычисляются адреса переопределяемых функций. Затем код переписывается на код скомпилированный через NASM. И при вызове кода, вызывается наш код. При остановке, код восстанавливается. При компиляции (а точнее перед линковкой) ищется OBJ файл переопределяемого модуля и код функций пустышек переписывается на ассемблерный код, и файл пересохраняется. Для этого я специально писал COFF парсер. Вообще это открывает кучу разных возможностей от замены функций рантайма на свои до шифрования кода. Вообщем много чего можно придумать. Проект, можно сказать, совсем не тестировался, т.к. у меня в ближайшее время не будет такой возможности, поэтому скорее-всего будет много багов, учитывая то, что половина функционала Add-in'а использует недокументированные трюки, которые возможно работают не так как я думаю. В проекте нет даже подсветки синтаксиса, у меня есть мой самодельный текстбокс с подсветкой написанный с нуля, но его нужно дебажить еще и дописывать, поэтому пока я использовать стандартный текстбокс. Если кого-нибудь заинтересует, и будут баги, пишите сюда. Всем спасибо за внимание. Скачать.
Какие-нибудь другие Add-in'ы сторонние есть? Работают? Сам VB6 корректно установлен? Посмотрел в отладчике, такая ошибка может быть если GetModuleFileName зафейлится.
Снял профайл по этой асм процедуре сложения, сделав есчо две на базовом(GRP) и через старый добрый FPU. Буфер размером 64M предварительно закрепляется в рабочем наборе при заполнении его рандомом. Для каждого набора выполняется сто циклов сложения элементов. i5 проц, стата(юзермод, ms): Для выравненного буфера: GRP 671 FPU 28250 MMX 262 mmx быстрее в данном случае чем gpr в 2.5 раза. fpu vs gpr: 42. Тот же тест для не выравненного буфера: GPR 688 FPU 28203 MMX 640 Тоесть сразу эффективность mmx исчезла - она существует только за счёт более быстрой выборки из памяти. 2.5 раза приращение профайла это слишком мало, оно вообще не заметно. Если например придётся сохранять NPX контекст(fxsave), то это приведёт к падению профайла в десятки раз(~20) и при использовании NPX шедулер начинает сохранять этот контекст, что сказывается в целом на профайле потока.
Indy_, две процедуры которые были добавлены использовали насыщение (именно ради него и приводился пример MMX)?
Thetrik Не знаю что за насыщение, обычное сложение: Код (Text): fild Q[esi] fild Q[edi] fadd st,st(1) fistp Q[edi] ffree st По теме инлайн асм в вб это интересно, как себя поведут ав на таком коде
Если при операции будет переполнение операнда-приемника, его значение устанавливается в MAX_UINT32, а не сбрасывается в меньшее значение.
Я просто попытался установить эту Inline, как обычно инсталлятор чего-либо запускают. VB6 есть, nanoVB, кастрированный VB. Ладно, чё с меня нуба взять. --- /spoiler Думается, АВ отвалятся, увидев импорт msvbvm6, или на первом ThunkRT вызове (в соответствующей теме, на днях, обсуждали невозможность эмулировать VB6 EXE, невозможность в течении уже более 15 лет). Интересно посмотреть на использование CUDA в расшифровщике. Тема не для этого раздела, да и такое вроде было уже, но все же, поглядеть бы на !компактные! вызовы CUDA-подобных обращений к GPU как к сопроцессору, так, чтобы прямо с ассемблерного уровня.
Отвечу сам себе http://www.asmcommunity.net/forums/topic/?id=30544#post-214310 ( гугл "calling gpu directly asm" ) , и там же, пост со строкой "Evolution of videocards and APIs:"
В том-то и суть что это не простое сложение, а (в данном примере): Код (C): res = a[i] + b[i]; if (res > 32767) res = 32767; else if (res < -32768) res = -32768; a[i] = res; И таких операций производится параллельно 4, если заюзать SSE то будет 8.
Не так давно тестил запуск из ресурсов на вб, для этих целей установил даже его. Там частично норм эмулилось, но подробности я уже не помню, может завтра посмотрю. Я только профайл снял, не вникая в детали
Нужно пробовать с обычным VB6. Установщик подразумевает что VB6 корректно установлен. Вроде делал один человек подобное на шейдерах, DirecеX9 позволяет компилировать шейдеры на ассемблере если я не ошибаюсь.
http://timjones.tw/blog/archive/2015/09/02/parsing-direct3d-shader-bytecode I didn’t want to take a dependency on Direct3D - so instead, I figured out how to disassemble compiled HLSL shaders back to assembly instructions, and then I wrote a virtual machine that can execute these assembly instructions entirely on the CPU. Оставлю это здесь. Да, снова виртуальные машины, байткод и никакого ТРУ асма. We need to go deeper (c). When you use a shader in Direct3D, these assembly instructions are parsed from the bytecode (much like we’re doing here), and sent to the GPU. Somewhere along the way (presumably in the GPU driver), the Direct3D assembly instructions will be compiled (again) into the GPU’s own assembly language, which is lower-level and hardware-specific. Gpu's own asm - это уже через порты вв-вывода/конфигурационное пространство в памяти, надо полагать.
https://board.flatassembler.net/topic.php?t=13293 CUDA in asm, x64 (на вин7-64 и gt 740M завершается с ошибкой)