Основы разработки антивирусного сканера

Основы разработки антивирусного сканера — Архив WASM.RU

Содержание

Введение

Простейшие типы вирусов

Методы детектирования

Контрольные суммы и технология их расчета

Использование контрольных сумм для детектирования вирусов

Алгоритм поиска файлов

Основы построения вирусной базы

Основы работы с вирусной базой

Заметки по лечению вирусов

Заключение

1. Введение

В этой статье речь пойдет о разработке примитивного антивирусного программного обеспечения, точнее сказать антивирусного сканера.

Сканнерами называют программы, которые проверяют файлы на предмет зараженности их известными программе вирусами.

Прочитав эту статью, я не гарантирую, того, что вы в тот же момент станете умнейшим вирусным аналитиком, эта область программирования достаточно необычна и тяжела для понимания. Сталкиваясь с ней (областью) «вплотную» в первый раз очень тяжело сразу «взять быка за рога». Но в этой статье я попытаюсь изложить основы, так что вполне возможно, то, что будет описано ниже вы, уже знали.

Прежде чем читать статью, необходимо удостовериться, что ваш уровень знаний ассемблера не ограничивается умением писать красивые интерфейсы и менюшки, в антивирусных программах это не главное. Конечно без удобного (дружелюбного) интерфейса ваша разработка не будет востребована. Но все же, необходимо иметь некоторые понятия о:

Контрольные суммы участков данных, что это такое и примерный алгоритм расчета

Вирусы и троянские кони в бинарных файлах (исполняемых файлах), а так же написанные на скриптовых языках (VBS, JavaScript)

Методы работы с файлами (поиск, запись, чтение и тд)

2. Простейшие вирусы

Вирус – программа очень маленьких размеров, основной задачей которой является распространение по компьютерам пользователей, за счет различных хитрых алгоритмов и ошибок пользователей.

Вирусы это очень сложные программы, их можно разделить на множество видов, но мы ограничимся всего двумя. Разделим вирусы на простейшие и файловые вирусы. Файловые вирусы это те, которые умеют заражать файлы различных форматов (загрузочные – PE, документы, файлы помощи и еще множество других), обычно эти вирусы написаны на языке ассемблера, и для их обнаружения необходимо очень хорошо знать структуру файлов, которые они поражают. Под понятием простейших вирусов я подразумеваю различных червей и сюда же можно приписать троянских коней.

Файловый вирус – вирус, который распространяется через зараженные файлы различных форматов, обычно исполняемых. Т.е. кто-то кому-то передал программу, один из исполняемых файлов которой был заражен вирусом.

Червь – вирус, который распространяется самостоятельно (не поражая какие либо файлы), обычно через глобальные сети, путем рассылки себя в письмах; авторами червей часто являются хакеры и для своего распространения черви используют различные дырки в операционных системах.

Троянские кони – программы, у которых отсутствуют функции самостоятельного распространения (т.е. они распространяются различными людьми специально), но обязательно присутствуют различные деструктивные функции.

Деструкция – алгоритм, причиняющий вред компьютеру и пользователи, иногда не только моральный, но и материальный. Деструктивные алгоритмы часто используются в вирусах и всегда используются в троянских конях.

Деструкция в троянских конях – это алгоритмы, которые могут совершать различные пакости, начиная от форматирования жесткого диска или перезаписи flashbios и заканчивая воровством «важных» файлов (паролей для доступа в интернет) с компьютера пользователя.

3. Методы детектирования

Главное, что черви и троянские кони не умеют заражать другие файлы, по этому всегда распространяются в одном и том же виде. Т.е. в виде не изменяющегося файла. Допустим, у нас имеется файл с вирусом-червем, который занимает 10 килобайт. Червь распространяется в виде исполняемого файла PortableExecutable. Нам необходимо написать программу антивирус против этого червя.

Программа будет искать PE-файлы в указанном каталоге

Каждый найденный файл размером 10 килобайт и больше будет открываться

Первые 10кб будут считываться, и сверяться с теми, которые были взяты из «тела» вируса

Если содержимое будет совпадать, то значит перед нами червь и нужно его вылечить

Мы составили примитивный алгоритм детектирования вируса червя. Теперь допустим, таким способом ваша программа опознает, и лечит 100 вирусов. В качестве сигнатуры (данных, по которым определяется зараженность объекта тем или иным вирусом) используется полный вирусный код, допустим для каждого вируса по 10 кб. В результате вирусная база (база данных программы содержащая алгоритмы по детектированию и лечению вирусов) программы будет занимать 1 мегабайт, а это очень много. Крупнейшие антивирусные программы детектируют несколько десятков тысяч самых разнообразных вирусов, и их вирусные базы занимают всего несколько мегабайт.

Детектирование (обнаружение) вирусов, не изменяющих своей структуры, является примитивнейшим занятием. И так сигнатура для детектирования вирусов может занимать всего 3 двойных слова, т.е. 12 байт и быть очень надежной, если использовать контрольные суммы …

4. Контрольные суммы и технология их расчета



Контрольная сумма это 32 битное число (очень редко 16 битное), которое характеризует определенный участок кода. Есть множество способов подсчета контрольной суммы, для лучшего восприятия этого термина рассмотрим пример примитивнейшего подсчета:

Например, у нас есть участок кода, состоящий из 5 байт (десятичная система): 001 004 000 005 100

По нашему примитивному подсчету, контрольная сумма его будет равняться 1+4+0+5+100=110. Т.е. прочитав контрольную сумму другого участка, мы получим другое значение. Однако, используя столь примитивный алгоритм расчета, контрольные суммы совершенно отличающихся участков могут совпадать, для этого используются более продвинутые процедуры подсчета.

Код (Text):

-----------------------

; подсчет контрольной суммы участка кода “sbuf”, длины “dlen”

; после подсчетов контрольная сумма будет

«положена» в “crc_buf”

Код (Text):

calculate_crc

Код (Text):

proc crc_buf: dword, sbuf:

dword, dlen: dword

Код (Text):

push eax ecx edx ebx esi edi

cld

mov esi,sbuf

mov edi,dlen

mov ecx,-1

mov edx,ecx

Код (Text):

next_byte:

Код (Text):

sub eax,eax

sub ebx,ebx

lodsb

xor al,cl

mov cl,ch

mov ch,dl

mov dl,dh

mov dh,8

Код (Text):

next_bit:

Код (Text):

shr ebx,1

rcr eax,1

jnc no_carry

xor eax,8320h

xor ebx,0edb8h

Код (Text):

no_carry:

Код (Text):

dec dh

jnz next_bit

xor ecx,eax

sub edx,ebx

dec edi

jnz next_byte

not edx

not ecx

mov eax,edx

ror eax,cl

add eax,ecx

mov edi,crc_buf

mov word ptr [edi],dx

mov word ptr [edi+2],cx

pop edi esi ebx edx ecx eax

ret

Код (Text):

endp

Комментарии к алгоритму расчета контрольной суммы (crc) отсутствуют потому, что достаточно понимать смысл подсчета crc, стандарта подсчета не существует, а описывать операции, производимые в этой процедуре достаточно тяжело и бессмысленно. Со временем будет появляться опыт в подобных вещах и если будет необходимо, то вы и сами разберетесь в коде.

5. Использование контрольных сумм для детектирования вирусов

Если необходимо подсчитать контрольную сумму участка в несколько килобайт, то это конечно не мгновенная процедура. Если считать контрольную сумму каждого найденного файла то процесс проверки не будет проходить так быстро как хотелось бы.

Возьмем в качестве примера вирус BAT.Sys.602, распространяющийся в виде файла BAT, написанного на примитивном языке Batch, входящим в комплект операционной системы DOS. Внешне вирус-червь представляет собой обычный текст.

Для опознавания наличия этого вируса в BAT-файлах совсем не обязательно считать контрольную сумму всего вирусного кода, достаточно взять участок кода, состоящий из нескольких строк. Так же просто необходимо запомнить их расположение в вирусном файле и длину этих строк (всех вместе). Допустим, нам приглянулись строки 4 и 5.

Как мы видим, строка 4 начинается в файле со смещения 75 (4Bhex) и заканчивается 150 (96 hex). Т.е. размер двух строк составляет 75 байт.

Но брать в качестве сигнатуры определенные строки не совсем обязательно, можно взять любой кусок кода, размер желательно до 100 байт, что бы время на расчет контрольной суммы затрачивалось минимальное.

Вашему вниманию предлагается пример программы, которая считает контрольную сумму участка кода выбранного выше (смещение 75, длина 75 байт) в файле ‘sys.bat’ …

Код (Text):

; компилировать: tasm32 –ml getcrc32.asm

; tlink32 -Tpe -c -x getcrc32.obj,,, import32

;

.386P

.model flat, stdcall

Код (Text):

extrn

extrn

extrn

extrn

extrn

extrn

include

FILE_BEGIN

OPEN_EXISTING

GENERIC_READ

Код (Text):

ExitProcess:near

ReadFile:near

CreateFileA:near

CloseHandle:near

GetFileSize:near

SetFilePointer:near

crc_proc.inc

equ 0

equ 3

equ 80000000h

Код (Text):

; список API использующихся программой

; здесь находится вышеуказанная процедура

; подсчета контрольной суммы

; для перевода указателя

; открыть файл уже существующий

; чтение данных из файла

Код (Text):

ENTRY_SIZE

Код (Text):

equ 1+260+4+318

Код (Text):

; размер одной ячейки для процесса поиска

Код (Text):

.data

Код (Text):

; сегмент данных

Код (Text):

number

handle

crc32_buf

crc32_code_loc

crc32_code_len

file_name

buffer

Код (Text):

dd ?

dd ?

dd ?

dd 75

dd 75

db ‘sys.bat’,0

db 1000 dup (?)

Код (Text):

; файловый номер

; для хранения посчитанной crc участка кода

; местоположение участка кода в файле

; длина участка кода

; файл с которым будем работать

; буфер для хранения участка кода

Код (Text):

.code

Код (Text):

; сегмент кода

Код (Text):

start:

Код (Text):

push 0 0

push OPEN_EXISTING

push 0 0

push GENERIC_READ

push offset file_name

call CreateFileA

cmp eax,-1

jnz read_file

Код (Text):

; откроем существующий файл ‘sys.bat’

; для чтения

; если все прошло успешно, продолжим

Код (Text):

error_opening:

</td>

<td width=252 valign=top>

<code><pre>

--------------------------------------------

jmp exit

Код (Text):

; «обработчик» ошибки открытия файла

Код (Text):

read_file:

Код (Text):

mov handle,eax

push 0 eax

call GetFileSize

mov ecx,dword ptr [crc32_code_loc]

add ecx,dword ptr [crc32_code_len]

cmp ecx,eax

jle set_pointer

push handle

call CloseHandle

jmp exit

Код (Text):

; сохраним файловый номер в “handle”

; eax – размер открытого файла в байтах

; ecx – расположение участка в файле

; ecx – смещение на конец участка

; если смещение на конец участка меньше

; чем размер файла, значит файл подходит

; иначе не тот файл

; закроем файл

; выйдем в ОС

Код (Text):

set_pointer:

Код (Text):

push FILE_BEGIN

push 0

push crc32_code_loc

push handle

call SetFilePointer

Код (Text):

; установим указатель на расположение

; необходимого участка в файле

Код (Text):

push 0

push offset number

push crc32_code_len

push offset buffer

push handle

call ReadFile

push handle

call CloseHandle

; прочитаем в “buffer” данные размером ; “crc32_code_len” изфайла ; закроемфайл

Код (Text):

push crc32_code_len

push offset buffer

push offset crc32_buf

call calculate_crc

Код (Text):

; длина участка crc которого нужно посчитать

; размещение данных участка

; куда «положить» посчитанную crc

; считаем crc участка

Код (Text):

exit:

</td>

<td width=252 valign=top>

<code><pre>

push 0

call ExitProcess

end start

Код (Text):

; выйдем в ОС

6. Алгоритм поиска файлов

Как вы уже, наверное, знаете для поиска файлов? используются API: FindFirstFile, FindNextFile, FindClose.

ПараметрамиFindFirstFile является маска для поиска и «место» под структуру для поиска (объявленную структуру официального типа или буфер, размер которого не меньше размера официальной структуры). Маской для поиска является обычная строка, содержащая путь к каталогу, в котором будет производиться поиск, а так же маску поиска (обычно используется “*.*”).

Вид официальной структуры для поиска:

Код (Text):

fnd_struc 

atr

cr_time

ac_time

wr_time

size_high

size_low

reserved

long_name

dos_name

fnd_struc 

Код (Text):

struc

dd ?

dd 2

dup (?)

dd 2

dup (?)

dd 2

dup (?)

dd ?

dd ?

dd 2

dup (?)

db

260 dup (?)

db 14

dup (?)

ends

Код (Text):

атрибут файла

время создания файла

время доступа к файлу

время модификации файла

размер файла

резерв

длинное имя файла

короткое имя файла

Можно объявлять эту структуру, а можно использовать эквивалент “findbuf db 314 dup (?)”. Немного разбираясь в программировании можно догадаться, что имя найденного файла будет находиться по смещению 44 от начала findbuf.Используем “movesi,offsetfindbuf + 44” и регистр esi указывает на имя найденного файла или каталога.

После выполнения API FindFirstFile, регистр eax будет содержать идентификатор поиска или в случае ошибки –1.

Вызов FindFirstFile используется только один раз, далее в дело вступает FindNextFile. Параметрами этой апи являются идентификатор поиска (который мы получили от вызова FindFirstFile и должны были сохранить) и та же структура для поиска (которая так же использовалась при первом поиске). Поиск ведется до тех пор, пока регистр eax не будет равняться нулю.

Эти API ищут файлы или каталоги по маске поиска, т.е. нельзя искать только файлы или только каталоги. Когда используется маска ‘*.*’ то будут найдены все каталоги и файлы, содержащиеся в указанном перед маской каталоге.

Все конечно хорошо, но необходимо что бы наша антивирусная программа могла проверять файлы не только в указанном каталоге, но и в тех, что расположены ниже. Для этого мы должны писать рекурсивную процедуру, т.е. такую, которая умеет вызывать сама себя.

Прежде всего, необходимо объявить переменную для поиска в каталогах содержащих множество других подкаталогов. Думаю, что пользователей, у которых количество подкаталогов в каталоге превышает 50 единицы, по этому ограничимся этим числом. И так, для процесса поиска в каждом каталоге должны быть индивидуальными (не использоваться в других процессах) маска поиска (максимум 260 символов), идентификатор поиска (двойное слово, 4 байта), структура для поиска (318 байт) и флаг (размером 1 байт, а для чего нужен этот флаг, я объясню позже). В результате мы должны объявить переменную а/ля ”buf db ( ( 1 + 260 + 4 + 318 ) * 50 )”. Ячейка для каждого процесса поиска будет занимать 1+260+4+318 = 583 байта и одновременно может вестись 50 процессов (не более). Конечно, можно использовать память из стека, но это будет тяжелее объяснить.

Структура размещения данных в ячейке может быть такой, какая удобна вам.

Я предлагаю структуру такого типа:

Код (Text):

 flag

mask

search_handle

find_structure



Код (Text):

 db ?

db

260 dup (?)

dd ?

db 318 dup (?)

Код (Text):

флаг поиска (0 – ищем только файлы, 1 – только каталоги)

маска для поиска в каталоге

идентификатор поиска

структура для поиска

Теперь поговорим о алгоритме поиска. Сначала необходимо обработать все файлы текущего каталога, а затем уже подкаталоги. Но API сначала находят подкаталоги, а потом уже файлы. Вот для этого и необходим флаг.

При первом поиске флаг настраивается только на поиск файлов, те если значение флага не совпадает с необходимым, то найденные каталоги просто пропускаются. По окончанию поиска флаг перенастраивается на поиск только каталогов, и теперь уже пропускаются файлы.

Давайте рассмотрим пример программы обходящей дерево каталогов в поиске всех файлов…

Код (Text):

; компилировать: tasm32 -ml walk.asm

; tlink32 -Tpe -c

-x walk.obj ,,, import32

;

.386P

.model flat, stdcall

Код (Text):

extrn

extrn

extrn

extrn

extrn

Код (Text):

lstrlenA:near

ExitProcess:near

FindFirstFileA:near

FindNextFileA:near

FindClose:near

Код (Text):

; список API использующихся программой

Код (Text):

ENTRY_SIZE

Код (Text):

equ 1+260+4+318

Код (Text):

; размер одной ячейки для процесса поиска

Код (Text):

.data

Код (Text):

; сегмент данных

Код (Text):

mask

search_dir

buffer

Код (Text):

db ‘\*.*’,0

db ‘c:\Program files’,0

db (ENTRY_SIZE*50)

dup (?)

Код (Text):

; маска для поиска

; начальный каталог для поиска

; буфер под 50 «одновременных» процессов поиска

Код (Text):

.code

Код (Text):

; сегмент кода

Код (Text):

start:

</td>

<td width=252 valign=top>

<code><pre>

mov esi,offset search_dir

push esi

call lstrlenA

xchg eax,ecx

inc ecx

mov edi,offset buffer

inc edi

rep movsb

Код (Text):

; esi – путь для поиска файлов

; получим размер пути в ASCII символах в eax

; обменяем значениями ecx и eax

; ecx = размер пути + NULL

; перенесем «полу готовую» маску для

; первого процесса поиска

Код (Text):

push offset buffer

call find

Код (Text):

; указатель на готовую структуру для поиска

Код (Text):

push 0

call ExitProcess

Код (Text):

; выйдем в ОС

Код (Text):

-----------------------

; поиск файлов с использованием указанной в “soff” ячейки (и последующих)

Код (Text):

find

Код (Text):

proc soff: dword

Код (Text):

mov ebx, soff

mov byte ptr [ebx],0

mov edi,ebx

inc edi

push edi

call lstrlenA

add edi,eax

cmp byte ptr [edi-1’,’*’

jz first_find

Код (Text):

; ebx – указатель на текущую ячейку

; установим флаг

(значение 0) на поиск файлов

; edi–1 – текущий каталог

; eax - длина пути в ASCII символах

; если маска уже присутствует в пути

; ищем первый объект (файл или каталог)

Код (Text):

check_slash:

Код (Text):

mov esi,offset mask

cmp byte ptr [edi-1],’\’

jnz nneed_slash

inc esi

Код (Text):

; esi – смещение общей маски для поиска

; проветим, есть ли слеш в конце пути

; если есть, то пропустим

Код (Text):

nneed_slash:

</td>

<td width=252 valign=top>

<code><pre>

push esi

call lstrlenA

inc eax

xchg eax,ecx

rep movsb

Код (Text):

; eax – длина маски

; прибавим NULL к длине

; дополним путь маской и слешем (если необходимо)

Код (Text):

find_first:

Код (Text):

mov edx,ebx

add edx,1+260+4

push edx

mov edx,ebx

inc edx

push edx

call FindFirstFileA

cmp eax,-1

jnz save_fnd_hndl

Код (Text):

; edx – указывает на ячейку процесса поиска

; edx – указывает на структуру для поиска

; первый параметр для API FindFirstFileA

; edx – указывает на ячейку процесса поиска

; edx – указывает на маску для поиска

; второй параметр

; выполним API

; если eax = -1 значит произошла ошибка

; иначе проверим найденный объект

Код (Text):

test_fod:

Код (Text):

cmp byte ptr [ebx],1

jz end_find

Код (Text):

; если флаг = 1, то поиск подкаталогов был уже

; проведен в этом каталоге, осталось закончить

; процесс

Код (Text):

set_filesfind:

Код (Text):

inc byte ptr [ebx]

jmp first_find

Код (Text):

; если флаг = 0, то все файлы в каталоге

; были обработаны, устанавливаем флагу

; значение 1 и обрабатываем подкаталоги

Код (Text):

end_find:

Код (Text):

push dword ptr [ebx+1+260]

call FindClose

ret

Код (Text):

; ebx = ebx + 1 + 260 = идентификатор поиска

; прекратим процесс поиска в каталоге

Код (Text):

; ----------------------

; процесс проверки найденного объекта

Код (Text):

save_fnd_hndl:

Код (Text):

mov dword ptr

[ebx+1+260],eax

Код (Text):

; сохраним идентификатор поиска

Код (Text):

lf:

Код (Text):

cmp byte

ptr [ebx+1+260+4+44],’.’

je find_next

Код (Text):

; пропустим подкаталоги “.” и “..”

Код (Text):

test_if_dir:

Код (Text):

test byte ptr

[ebx+1+260+4],10h

jz found_file

Код (Text):

; перейдем если нашли файл

Код (Text):

proc_dir:

Код (Text):

cmp byte ptr [ebx],1

jnz find_next

Код (Text):

; если ищем только файлы (флаг = 0), то

; каталоги не трогаем

Код (Text):

;----------------------

; если файлы каталога были проверены, то по очереди будут проверяться подкаталоги.

; подготавливаем маску поиска для найденного подкаталога в следующей ячейке и запускаем себя

Код (Text):

prepare_rec:

Код (Text):

mov edi,ebx

add edi,( ( ENTRY_SIZE ) + 1 )

mov esi,ebx

inc esi

push esi

call lstrlenA

xchg eax,ecx

sub ecx,4

cmp byte ptr [esi+ecx],’\’

jnz not_root

inc ecx

Код (Text):

; edi – ячейка текущего процесса поиска

; edi – ячейка следующего процесса поиска+1

; esi – ячейка текущего процесса поиска

; esi – маска поиска текущего процесса

; eax - длина маски поиска текущего процесса

; отнимем от длины 4 символа (маску и слеш)

; корневой каталог, …

; … оставим слеш

Код (Text):

not_root:

Код (Text):

rep movsb

Код (Text):

; перенесем «полу готовую маску» в

; следующую ячейку

Код (Text):

mov esi,ebx

add esi,1+260+4+44

push esi

call lstrlenA

inc eax

xchg eax,ecx

rep movsb

add ebx,(ENTRY_SIZE)

push ebx

call find

sub ebx,(ENTRY_SIZE)

jmp find_next

Код (Text):

; esi – имя найденного подкаталога

; eax – длина найденного подкаталога

; eax – длина найденного подкаталога + 0

; дополнить маску найденным подкаталогом

; ebx – ячейка следующего процесса поиска

; параметр для вызова “себя”

; ищем в подкаталоге

; ebx – ячейка этого процесса поиска

; ищем следующий объект

Код (Text):

found_file:

</td>

<td width=252 valign=top>

<code><pre>

cmp byte ptr [ebx],1

jz find_next

--------------------------------------------

Код (Text):

; если ищем каталоги, то файлы не трогаем

; код для работы с найденными файлами

Код (Text):

find_next:

Код (Text):

mov edx,ebx

add edx,1+260+4

push edx

push dword ptr [ebx+1+260]

call FindNextFileA

cmp eax,0

jnz

lf

jmp test_fod

Код (Text):

; edx – указывает на структуру для поиска

; первый параметр для API FindNextFileA

; второй параметр идентификатор поиска

; выполним API

; если нашли объект, проведем его анализ

; если ничего не нашли

Код (Text):

endp

Код (Text):

end start

7. Основы построения вирусной базы

Данные необходимые для поиска и лечения вирусов обычно хранятся в вирусной базе. Ее формат может быть любым, стандартов не существует. Мы рассмотрим пример вирусной базы для детектирования скрипт вирусов, которая будет содержаться в исходном коде программы, а не в отдельном файле.

Код (Text):

vir_no

vir_001_name

vir_001_sig

Код (Text):

 dd 3

db ‘BAT.Sys.602’,0

db 8 dup (?)

dd 161412090

Код (Text):

количество вирусов в базе данных

название вируса в ASCII кодировке

размер названия 20 байт, оставшиеся байты

сигнатура участка длиной 75 байт, по смещению 75 кода вируса,

она же сигнатура для детектирования

Код (Text):

vir_002_name

vir_002_crc32

Код (Text):

db ‘VBS.Links’,0

db 010 dup (?)

dd 1138651542

Код (Text):

vir_003_name

vir_003_sig

Код (Text):

db ‘VBS.ILoveYou’,0

db 7 dup (?)

dd 3434909282

Вот мы имеем простейшую вирусную базу для трех вирусов. Размер одной вирусной записи (данных об одном вирусе, необходимых для его детектирования и лечения) в данном случае составляет 20 + 4 = 24 байта.

Если же вирусная база хранится в отдельном файле, то при старте антивирусный сканер должен загрузить ее в память, для того, чтобы к данным, хранящимся в ней, было быстрее и проще «обращаться» в необходимости. Для этого пишутся специальные процедуры разбора, ну и конечно же вирусные записи содержат гораздо больше данных, например таких как тип вируса, адреса процедур для детектирования и лечения … Но обо всем этом в следующий раз, в следующих статьях.

8. Основы работы с вирусной базой

В нашем случае, необходимо писать процедуру для работы с найденными файлами, т.е. читать данные из файла по смещению 75 и размером 75 байт, считать контрольную сумму и сравнивать по очереди с указанной во всех доступных (в нашем случае 2) вирусных записях в вирусной базе. Если совпадает, выводит информацию о том, что найденный файл заражен определенным вирусом.

Допустим, программа нашла файл, прочитала из него 75 байт по смещению 75 и подсчитала контрольную сумму этого участка. Контрольная сумма содержится в переменной “crc32_buf”. Вот как должен выглядеть процесс проверки на зараженность известными программе вирусами:

Код (Text):

mov eax,dword ptr crc32_buf

mov ecx,dword ptr vir_no

mov esi,offset vir_001_name

Код (Text):

; eax – контрольная сумма участка

; ecx – количество вирусов в базе

; esi – начало первой вирусной записи

Код (Text):

cmp_crc32_loop:

Код (Text):

push ecx esi

cmp eax,dword ptr [esi+20]

jnz next_crc

pop esi ecx

Код (Text):

; запомним данные регистров

; проверим контрольную сумму с вирусной

; если не совпадает перейдем к “next_crc”

; востановим значение регистров

Код (Text):

infected:

--------------------------------------------

Код (Text):

; если файл заражен вирусом …

Код (Text):

next_crc:

Код (Text):

pop esi ecx

add esi,24

loop

cmp_crc32_loop

Код (Text):

; восстановим значение регистров

; перейдем к следующей вирусной записи

; цикл

9. Заметки по лечению вирусов

В данном случае найденные файлы с вирусами можно просто удалять, но это самые простейшие вирусы. Обычно каждый вирус изменяет что-то в файлах настройках операционной системы, пытается спрятаться от чужих глаз. Даже для вирусов, файлы носители которых (дропперы) можно просто удалять это (скорее всего) не будет являться сто процентным лечением. Необходим анализ алгоритма работы вируса, вполне возможно он уже (например) успел прописать свой вызов в WIN.INI из «потайного места». Так как эти типы вирусов не заражают файлов, то от них мог бы избавиться любой начинающий пользователь. Авторы таких вирусов знают это и для этого предпринимают разнообразные хитрые методы для того, что бы вирус мог выжить после «чистки», вернуться «к жизни» второй раз.

10. Заключение

Соответственно если Вы заинтересовались этой областью программирования, придется разбираться и изучать (хотя бы основы) множество скрипт языков программирования. Я не говорю про основы строения исполняемых файлов написанных не на ассемблере, а на языках высокого уровня. Как раз на них и пишется большинство троянских коней. Необходимо будет разбираться с различными упаковщиками и шифровщиками исполняемых файлов, строением архивов …

Все примеры программ, которые были представлены Вашему вниманию в статье, доступны в ZIP-архиве, но в немного измененном виде. Добавлен вывод «рабочей информации» через консоль и почти полностью отсутствуют комментарии к программе, но в статье комментариев изобилие.

Готовое подобие антивирусного сканера так же доступно, а так же прилагаются КУСКИ вирусных дропперов, которые вставлены в базу антивируса (которую мы рассматривали выше). Полный вирусный код я не представляю, так как в этом нет необходимости.

Если статья действительно кому-нибудь поможет, то я буду писать на эту тему еще … например про основы детектирования и лечения файловых вирусов, технологии анализа программного кода (кодо-анализаторов) и эмуляции программного кода (для детектирования полиморфных и шифрованных вирусов) …

Код (Text): ----------------------- ; подсчет контрольной суммы участка кода “sbuf”, длины “dlen” ; после подсчетов контрольная сумма будет «положена» в “crc_buf”
Код (Text): <u>calculate_crc</u>	Код (Text): proc crc_buf: dword, sbuf: dword, dlen: dword
	Код (Text): push eax ecx edx ebx esi edi cld mov esi,sbuf mov edi,dlen mov ecx,-1 mov edx,ecx
Код (Text): next_byte:	Код (Text): sub eax,eax sub ebx,ebx lodsb xor al,cl mov cl,ch mov ch,dl mov dl,dh mov dh,8
Код (Text): next_bit:	Код (Text): shr ebx,1 rcr eax,1 jnc no_carry xor eax,8320h xor ebx,0edb8h
Код (Text): no_carry:	Код (Text): dec dh jnz next_bit xor ecx,eax sub edx,ebx dec edi jnz next_byte not edx not ecx mov eax,edx ror eax,cl add eax,ecx mov edi,crc_buf mov word ptr [edi],dx mov word ptr [edi+2],cx pop edi esi ebx edx ecx eax ret
Код (Text): <b><u>endp</u></b>

Код (Text): ; компилировать: tasm32 –ml getcrc32.asm ; tlink32 -Tpe -c -x getcrc32.obj,,, import32 ; .386P .model flat, stdcall
Код (Text): extrn extrn extrn extrn extrn extrn <b><u>include</u></b> FILE_BEGIN OPEN_EXISTING GENERIC_READ	Код (Text): ExitProcess:near ReadFile:near CreateFileA:near CloseHandle:near GetFileSize:near SetFilePointer:near <b><u>crc_proc.inc</u></b> equ 0 equ 3 equ 80000000h	Код (Text): ; список API использующихся программой ; здесь находится вышеуказанная процедура ; подсчета контрольной суммы ; для перевода указателя ; открыть файл уже существующий ; чтение данных из файла
Код (Text): ENTRY_SIZE	Код (Text): equ 1+260+4+318	Код (Text): ; размер одной ячейки для процесса поиска
Код (Text): .data		Код (Text): ; сегмент данных
Код (Text): number handle crc32_buf crc32_code_loc crc32_code_len file_name buffer	Код (Text): dd ? dd ? dd ? dd 75 dd 75 db ‘sys.bat’,0 db 1000 dup (?)	Код (Text): ; файловый номер ; для хранения посчитанной crc участка кода ; местоположение участка кода в файле ; длина участка кода ; файл с которым будем работать ; буфер для хранения участка кода
Код (Text): .code		Код (Text): ; сегмент кода
Код (Text): <b><u>start</u></b>:	Код (Text): push 0 0 push OPEN_EXISTING push 0 0 push GENERIC_READ push offset file_name call <b>CreateFileA</b> cmp eax,-1 jnz read_file	Код (Text): ; откроем существующий файл ‘sys.bat’ ; для чтения ; если все прошло успешно, продолжим
Код (Text): error_opening: </td> <td width=252 valign=top> <code><pre> -------------------------------------------- jmp exit	Код (Text): ; «обработчик» ошибки открытия файла
Код (Text): read_file:	Код (Text): mov handle,eax push 0 eax call <b>GetFileSize</b> mov ecx,dword ptr [crc32_code_loc] add ecx,dword ptr [crc32_code_len] cmp ecx,eax jle set_pointer push handle call <b>CloseHandle</b> jmp exit	Код (Text): ; сохраним <i>файловый номер</i> в “handle” ; eax – размер открытого файла в байтах ; ecx – расположение участка в файле ; ecx – смещение на конец участка ; если смещение на конец участка меньше ; чем размер файла, значит файл подходит ; иначе не тот файл ; закроем файл ; выйдем в ОС
Код (Text): set_pointer:	Код (Text): push FILE_BEGIN push 0 push crc32_code_loc push handle call <b>SetFilePointer</b>	Код (Text): ; установим указатель на расположение ; необходимого участка в файле
	Код (Text): push 0 push offset number push crc32_code_len push offset buffer push handle call <b>ReadFile</b> push handle call <b>CloseHandle</b>	; прочитаем в “buffer” данные размером ; “crc32_code_len” изфайла ; закроемфайл
	Код (Text): push crc32_code_len push offset buffer push offset crc32_buf call calculate_crc	Код (Text): ; длина участка crc которого нужно посчитать ; размещение данных участка ; куда «положить» посчитанную crc ; считаем crc участка
Код (Text): exit: </td> <td width=252 valign=top> <code><pre> push 0 call <b>ExitProcess</b> end <b><u>start</u></b>	Код (Text): ; выйдем в ОС

Код (Text): ; компилировать: tasm32 -ml walk.asm ; tlink32 -Tpe -c -x walk.obj ,,, import32 ; .386P .model flat, stdcall
Код (Text): extrn extrn extrn extrn extrn	Код (Text): lstrlenA:near ExitProcess:near FindFirstFileA:near FindNextFileA:near FindClose:near	Код (Text): ; список API использующихся программой
Код (Text): ENTRY_SIZE	Код (Text): equ 1+260+4+318	Код (Text): ; размер одной ячейки для процесса поиска
Код (Text): .data		Код (Text): ; сегмент данных
Код (Text): mask search_dir buffer	Код (Text): db ‘\.’,0 db ‘c:\Program files’,0 db (ENTRY_SIZE*50) dup (?)	Код (Text): ; <i>маска для поиска</i> ; начальный каталог для поиска ; буфер под 50 «одновременных» <i>процессов поиска</i>
Код (Text): .code		Код (Text): ; сегмент кода
Код (Text): <b><u>start:</u></b> </td> <td width=252 valign=top> <code><pre> mov esi,offset <u>search_dir</u> push esi call <b>lstrlenA</b> xchg eax,ecx inc ecx mov edi,offset <u>buffer</u> inc edi rep movsb	Код (Text): ; esi – путь для поиска файлов ; получим размер пути в ASCII символах в eax ; обменяем значениями ecx и eax ; ecx = размер пути + NULL ; перенесем «полу готовую» маску для ; первого процесса поиска
	Код (Text): push offset <u>buffer</u> call find	Код (Text): ; указатель на готовую структуру для поиска
	Код (Text): push 0 call <b>ExitProcess</b>	Код (Text): ; выйдем в ОС
Код (Text): ----------------------- ; поиск файлов с использованием указанной в “soff” ячейки (и последующих)
Код (Text): <b><u>find</u></b>	Код (Text): <b><u>proc <i>soff</i>: dword</u></b>
	Код (Text): mov ebx, <i>soff</i> mov byte ptr [ebx],0 mov edi,ebx inc edi push edi call <b>lstrlenA</b> add edi,eax cmp byte ptr [edi-1’,’*’ jz first_find	Код (Text): ; ebx – указатель на текущую ячейку ; установим флаг (значение 0) на поиск файлов ; edi–1 – текущий каталог ; eax - длина пути в ASCII символах ; если маска уже присутствует в пути ; ищем первый объект (файл или каталог)
Код (Text): check_slash:	Код (Text): mov esi,offset <u>mask</u> cmp byte ptr [edi-1],’\’ jnz nneed_slash inc esi	Код (Text): ; esi – смещение общей маски для поиска ; проветим, есть ли слеш в конце пути ; если есть, то пропустим
Код (Text): nneed_slash: </td> <td width=252 valign=top> <code><pre> push esi call lstrlenA inc eax xchg eax,ecx rep movsb	Код (Text): ; eax – длина маски ; прибавим NULL к длине ; дополним путь маской и слешем (если необходимо)
Код (Text): find_first:	Код (Text): mov edx,ebx add edx,1+260+4 push edx mov edx,ebx inc edx push edx call <b>FindFirstFileA</b> cmp eax,-1 jnz save_fnd_hndl	Код (Text): ; edx – указывает на ячейку процесса поиска ; edx – указывает на <i>структуру для поиска</i> ; первый параметр для API <b>FindFirstFileA</b> ; edx – указывает на ячейку процесса поиска ; edx – указывает на <i>маску для поиска</i> ; второй параметр ; выполним API ; если eax = -1 значит произошла ошибка ; иначе проверим найденный объект
Код (Text): test_fod:	Код (Text): cmp byte ptr [ebx],1 jz end_find	Код (Text): ; если <i>флаг</i> = 1, то поиск подкаталогов был уже ; проведен в этом каталоге, осталось закончить ; процесс
Код (Text): set_filesfind:	Код (Text): inc byte ptr [ebx] jmp first_find	Код (Text): ; если <i>флаг </i>= 0, то все файлы в каталоге ; были обработаны, устанавливаем <i>флагу</i> ; значение 1 и обрабатываем подкаталоги
Код (Text): end_find:	Код (Text): push dword ptr [ebx+1+260] call <b>FindClose</b> ret	Код (Text): ; ebx = ebx + 1 + 260 = <i>идентификатор поиска</i> ; прекратим процесс поиска в каталоге
Код (Text): ; ---------------------- ; процесс проверки найденного объекта
Код (Text): save_fnd_hndl:	Код (Text): mov dword ptr [ebx+1+260],eax	Код (Text): ; сохраним <i>идентификатор поиска</i>
Код (Text): lf:	Код (Text): cmp byte ptr [ebx+1+260+4+44],’.’ je find_next	Код (Text): ; пропустим подкаталоги “.” и “..”
Код (Text): test_if_dir:	Код (Text): test byte ptr [ebx+1+260+4],10h jz found_file	Код (Text): ; перейдем если нашли файл
Код (Text): proc_dir:	Код (Text): cmp byte ptr [ebx],1 jnz find_next	Код (Text): ; если ищем только файлы (<i>флаг</i> = 0), то ; каталоги не трогаем
Код (Text): ;---------------------- ; если файлы каталога были проверены, то по очереди будут проверяться подкаталоги. ; подготавливаем <i>маску поиска </i>для найденного подкаталога в следующей ячейке и запускаем себя
Код (Text): prepare_rec:	Код (Text): mov edi,ebx add edi,( ( ENTRY_SIZE ) + 1 ) mov esi,ebx inc esi push esi call <b>lstrlenA</b> xchg eax,ecx sub ecx,4 cmp byte ptr [esi+ecx],’\’ jnz not_root inc ecx	Код (Text): ; edi – ячейка текущего процесса поиска ; edi – ячейка следующего процесса поиска+1 ; esi – ячейка текущего процесса поиска ; esi – <i>маска поиска </i>текущего процесса ; eax - длина <i>маски поиска </i>текущего процесса ; отнимем от длины 4 символа (маску и слеш) ; корневой каталог, … ; … оставим слеш
Код (Text): not_root:	Код (Text): rep movsb	Код (Text): ; перенесем «полу готовую маску» в ; следующую ячейку
	Код (Text): mov esi,ebx add esi,1+260+4+44 push esi call <b>lstrlenA</b> inc eax xchg eax,ecx rep movsb add ebx,(ENTRY_SIZE) push ebx call <b><u>find</u></b> sub ebx,(ENTRY_SIZE) jmp find_next	Код (Text): ; esi – имя найденного подкаталога ; eax – длина найденного подкаталога ; eax – длина найденного подкаталога + 0 ; дополнить маску найденным подкаталогом ; ebx – ячейка следующего процесса поиска ; параметр для вызова “себя” ; ищем в подкаталоге ; ebx – ячейка этого процесса поиска ; ищем следующий объект
Код (Text): found_file: </td> <td width=252 valign=top> <code><pre> cmp byte ptr [ebx],1 jz find_next --------------------------------------------	Код (Text): ; если ищем каталоги, то файлы не трогаем ; код для работы с найденными файлами
Код (Text): find_next:	Код (Text): mov edx,ebx add edx,1+260+4 push edx push dword ptr [ebx+1+260] call <b>FindNextFileA</b> cmp eax,0 jnz lf jmp test_fod	Код (Text): ; edx – указывает на <i>структуру для поиска</i> ; первый параметр для API <b>FindNextFileA</b> ; второй параметр <i>идентификатор поиска</i> ; выполним API ; если нашли объект, проведем его анализ ; если ничего не нашли
Код (Text): <b><u>endp</u></b>
	Код (Text): end <b><u>start</u></b>

Код (Text): vir_no vir_001_name vir_001_sig	Код (Text): <i> </i>dd 3 db ‘BAT.Sys.602’,0 db 8 dup (?) dd 161412090	Код (Text): <b>количество вирусов в базе данных</b> <b>название вируса в </b><b>ASCII кодировке</b> <b>размер названия 20 байт, оставшиеся байты</b> <b>сигнатура участка длиной 75 байт, по смещению 75 кода вируса, она же сигнатура для детектирования</b>
Код (Text): vir_002_name vir_002_crc32	Код (Text): db ‘VBS.Links’,0 db 010 dup (?) dd 1138651542
Код (Text): vir_003_name vir_003_sig	Код (Text): db ‘VBS.ILoveYou’,0 db 7 dup (?) dd 3434909282

	Код (Text): mov eax,dword ptr crc32_buf mov ecx,dword ptr vir_no mov esi,offset vir_001_name	Код (Text): ; eax – контрольная сумма участка ; ecx – количество вирусов в базе ; esi – начало первой <i>вирусной записи</i>
Код (Text): cmp_crc32_loop:	Код (Text): push ecx esi cmp eax,dword ptr [esi+20] jnz next_crc pop esi ecx	Код (Text): ; запомним данные регистров ; проверим контрольную сумму с вирусной ; если не совпадает перейдем к “next_crc” ; востановим значение регистров
Код (Text): infected:	--------------------------------------------	Код (Text): ; если файл заражен вирусом …
Код (Text): next_crc:	Код (Text): pop esi ecx add esi,24 loop cmp_crc32_loop	Код (Text): ; восстановим значение регистров ; перейдем к следующей <i>вирусной записи</i> ; цикл

Войти или зарегистрироваться

Основы разработки антивирусного сканера

Основы разработки антивирусного сканера — Архив WASM.RU

archive
New Member

Войти или зарегистрироваться

Основы разработки антивирусного сканера

Основы разработки антивирусного сканера — Архив WASM.RU

archive New Member

Быстрый поиск

archive
New Member