связка Visual C++ 2017 с MASM

MaKsIm · 21 фев 2025

kol1978 сказал(а): ↑

Шестнадцать 64-разрядных регистров RAX, RBX, RCX, RDX, RSI, RDI, RBP, RSP, R8, R9, R10, R11, R12, R13, R14 и R15) и только это делает его "шестидесяти четырёх разрядным". И! условно - шина адреса 32 разрядная, от этого ограничение в 2 гига. - Так?
Нажмите, чтобы раскрыть...

Ну вот вам точно стоило бы почитать мою ссылку и тогда бы не писали такое...
Какое отношение разрядность шины адреса имеет к размерам регистров? Например, сейчас у вашего ЦПУ шина адреса 48-бит, а у серверных моделей встречается шина адреса в 57-бит, хотя регистры общего назначения 64-битные.

А ограничение в 2 Гб не связано с возможностью адресоваться по абсолютному адресу... Просто прочитайте то что я вам дал.

aa_dav · 21 фев 2025

kol1978 сказал(а): ↑

почему не объяснили значение -mcmodel=large?
Нажмите, чтобы раскрыть...

Ты неисправим.

Вот скажи мне зачем тебе что-то пытаться объяснять, если ты не читаешь? Это касается просто всего что ты в ответ пишешь - все ответы были ранее по тексту.
Ты последние две страницы каждый раз когда что-то спрашиваешь - это был ранее по тексту.
Соберись уже и перечитай тему, может несколько раз, бывает что пока чего то одно в голове не отложится, информация новая не зайдёт. Тогда просто надо перечитать.

MaKsIm · 21 фев 2025

kol1978 сказал(а): ↑

Это ограничение преодолевается использованием расширения физического адреса (PAE) позволяет преодолеть этот барьер за счёт расширения адресов, используемых для представления сопоставлений между виртуальной и физической памятью.
Нажмите, чтобы раскрыть...

Все в кучу. Какое отношение PAE имеет к смещению в командах. Вы технологию расширения физического адресного пространства смешали с адресацией на уровне команд. А вашу текущую пользовательскую программу едва допускают кувыркаться в виртуальных адресах памяти. Т.е. вы даже с сегментами не работаете, а просто создаете оффсеты.

И так вообще то PAE уже давно не актуален. Для x86_64 PAE не используется. Он для расширения 32-битных процов был сделаг, где 64-битных регистров и в помине не было от слова совсем.

Intro · 21 фев 2025

Я из-за таких сложностей стараюсь использовать х86-32, всё таки проще, ну и что что меньше регистров. Так же неработает некоторый из х86-32. Вот так пришлось делать:

Код (ASM):

foreach MACRO it_reg:req, vec:req

.for (it_reg = vec._Myfirst: it_reg < vec._Mylast: it_reg += vec._Mysizeclass)

EXITM <>

ENDM

static_vector struct ;(sizeof=24, align=8)

_Myfirst qword ? ; 0 pointer to beginning of array указатель на начало массива

_Mylast qword ? ; 8 pointer to current end of sequence указатель на текущий конец последовательности

_Mysizeclass qword ? ; 16 размер класса в байтах

static_vector ends

static_vector@init = 0

static_vector@@push MACRO name_vec:req, name_class:req, data:vararg

LOCAL lbl_begin,lbl_end

lbl_begin TEXTEQU <>

lbl_end TEXTEQU <>

IF static_vector@init EQ 0 ;;создание и загрузка данных в вектор

lbl_begin CATSTR <autogenerate??>,<name_vec>,<?begin>

align_data

lbl_begin name_class data

static_vector@init = 1

ELSEIFNB <data> ;;загрузка данных в вектор

name_class data

ELSE ;;завершения загрузки данных в вектор

lbl_begin CATSTR <autogenerate??>,<name_vec>,<?begin>

lbl_end CATSTR <autogenerate??>,<name_vec>,<?end>

lbl_end label name_class

align_data

name_vec static_vector { offset lbl_begin, offset lbl_end, sizeof name_class }

static_vector@init = 0

;% echo @CatStr(%.type ptr )

ENDIF

EXITM <>

ENDM

Это небольшая часть библиотеки для перебора коллекций на ассемблере, это именно const static, если делать массивами как раньше, то на х86-64 появляются проблемы из-за указанного выше. Есть ещё с динамическими данными, но там недоделано...

kol1978 · 21 фев 2025

MaKsIm сказал(а): ↑

Все в кучу. Какое отношение PAE имеет к смещению в командах. Вы технологию расширения физического адресного пространства смешали с адресацией на уровне команд. А вашу текущую пользовательскую программу едва допускают кувыркаться в виртуальных адресах памяти. Т.е. вы даже с сегментами не работаете, а просто создаете оффсеты.

И так вообще то PAE уже давно не актуален. Для x86_64 PAE не используется. Он для расширения 32-битных процов был сделаг, где 64-битных регистров и в помине не было от слова совсем.
Нажмите, чтобы раскрыть...

Парни! вы слишком много вопросов на вопрос задаёте юзеру из секции новичков..."смещению в командах" - у меня эти два слова в контексте нигде не фигурируют! просил рассуждать про "команду" : команду mov rax,[Val] - тут есть смещение/оффсеты-сегментно-виртуально-физических адресов?

--- Сообщение объединено, 21 фев 2025 ---

Intro сказал(а): ↑

Я из-за таких сложностей стараюсь использовать х86-32, всё таки проще, ну и что что меньше регистров. Так же неработает некоторый из х86-32. Вот так пришлось делать:

Код (ASM):

foreach MACRO it_reg:req, vec:req

.for (it_reg = vec._Myfirst: it_reg < vec._Mylast: it_reg += vec._Mysizeclass)

EXITM <>

ENDM

static_vector struct ;(sizeof=24, align=8)

_Myfirst qword ? ; 0 pointer to beginning of array указатель на начало массива

_Mylast qword ? ; 8 pointer to current end of sequence указатель на текущий конец последовательности

_Mysizeclass qword ? ; 16 размер класса в байтах

static_vector ends

static_vector@init = 0

static_vector@@push MACRO name_vec:req, name_class:req, data:vararg

LOCAL lbl_begin,lbl_end

lbl_begin TEXTEQU <>

lbl_end TEXTEQU <>

IF static_vector@init EQ 0 ;;создание и загрузка данных в вектор

lbl_begin CATSTR <autogenerate??>,<name_vec>,<?begin>

align_data

lbl_begin name_class data

static_vector@init = 1

ELSEIFNB <data> ;;загрузка данных в вектор

name_class data

ELSE ;;завершения загрузки данных в вектор

lbl_begin CATSTR <autogenerate??>,<name_vec>,<?begin>

lbl_end CATSTR <autogenerate??>,<name_vec>,<?end>

lbl_end label name_class

align_data

name_vec static_vector { offset lbl_begin, offset lbl_end, sizeof name_class }

static_vector@init = 0

;% echo @CatStr(%.type ptr )

ENDIF

EXITM <>

ENDM

Это небольшая часть библиотеки для перебора коллекций на ассемблере, это именно const static, если делать массивами как раньше, то на х86-64 появляются проблемы из-за указанного выше. Есть ещё с динамическими данными, но там недоделано...
Нажмите, чтобы раскрыть...

это просто флуд.... в формате данного поста: даже про непонятность промолчу...

MaKsIm · 21 фев 2025

kol1978 сказал(а): ↑

команду mov rax,[Val] - тут есть смещение/оффсеты-сегментно-виртуально-физических адресов?
Нажмите, чтобы раскрыть...

Тут есть оффсет: mov rax,[Val]

kol1978 · 21 фев 2025

MaKsIm сказал(а): ↑

Ну вот вам точно стоило бы почитать мою ссылку и тогда бы не писали такое...
Какое отношение разрядность шины адреса имеет к размерам регистров? Например, сейчас у вашего ЦПУ шина адреса 48-бит, а у серверных моделей встречается шина адреса в 57-бит, хотя регистры общего назначения 64-битные.

А ограничение в 2 Гб не связано с возможностью адресоваться по абсолютному адресу... Просто прочитайте то что я вам дал.
Нажмите, чтобы раскрыть...

это звучит так: читайте внимательно документацию интел и не задавайте глупых вопросов... так что это просто флуд.

--- Сообщение объединено, 21 фев 2025 ---

MaKsIm сказал(а): ↑

Тут есть оффсет: mov rax,[Val]
Нажмите, чтобы раскрыть...

считаю что офсета тут нет! вот и что то прояснилось... поясните где офсет? [Val] - это адрес переменной Val.

--- Сообщение объединено, 21 фев 2025 ---

aa_dav сказал(а): ↑

Ты неисправим.
Посмотреть вложение 9611

Вот скажи мне зачем тебе что-то пытаться объяснять, если ты не читаешь? Это касается просто всего что ты в ответ пишешь - все ответы были ранее по тексту.
Ты последние две страницы каждый раз когда что-то спрашиваешь - это был ранее по тексту.
Соберись уже и перечитай тему, может несколько раз, бывает что пока чего то одно в голове не отложится, информация новая не зайдёт. Тогда просто надо перечитать.
Нажмите, чтобы раскрыть...

В это что то есть...но не совсем понятно - просил перефразировать.

--- Сообщение объединено, 21 фев 2025 ---

aa_dav сказал(а): ↑

Ты неисправим.
Посмотреть вложение 9611

Вот скажи мне зачем тебе что-то пытаться объяснять, если ты не читаешь? Это касается просто всего что ты в ответ пишешь - все ответы были ранее по тексту.
Ты последние две страницы каждый раз когда что-то спрашиваешь - это был ранее по тексту.
Соберись уже и перечитай тему, может несколько раз, бывает что пока чего то одно в голове не отложится, информация новая не зайдёт. Тогда просто надо перечитать.
Нажмите, чтобы раскрыть...

Давай еще раз - почему файл не компилируется? :

Код (Text):

.text #расположение исполняемого кода

.globl main;

main: #точка входа

endbr64

pushq %rbp

movq %rsp, %rbp

movl $15, %edx

leaq message(%rip), %rax

movq %rax, %rsi

movl $1, %edi

call write

movl $0, %edi

call _exit

. = main + 2147483648 #перемещение из позиции гигабайта

.data

message:

.string "Hello, world!\n"

компиляция: gcc -mcmodel=large -fpie -Os -m64 hello.s -o hello

MaKsIm · 21 фев 2025

Вот две инструкции загрузки в rax учетверенного слова по смещению

И вот что из себя представляют их опкоды:

0x48 это как раз REX.W префикс, дальше опкод 0xA1 или 0x8B и вот уже дальше все зависит от опкода инструкции: для 0xA1 идет просто 64-битное смещение указатель на ячейку памяти, а вот для 0x8B там уже присутствует байт modr/m, который расшифровывается как rip+offset32. Так получается, что данные идут сразу за этими двумя командами и значения разные, но адреса одни и те же.
Как можете видеть обе команды ссылаются на одну и туже переменную, но вот кодируются по разному.

--- Сообщение объединено, 21 фев 2025 ---

kol1978 сказал(а): ↑

считаю что офсета тут нет! вот и что то прояснилось... поясните где офсет? [Val] - это адрес переменной Val.
Нажмите, чтобы раскрыть...

Вы разберитесь с терминами в документации intel. А вашем случае этот "адрес переменной" на самом деле оффсет от начала сегмента.

--- Сообщение объединено, 21 фев 2025 ---

Вот что по этому поводу говорит документация Intel

Как можете увидеть для команды A1 в коде установлено использование moffs64 (memory offset 64-bit). Для команды с байтом mod reg, r/m надо смотреть таблицу декодирования этого байта и там мы увидим

И тут мы видим сокращение disp (displacement), что можно перевести как отступ или смещение (offset)

aa_dav · 21 фев 2025

kol1978 сказал(а): ↑

...
Нажмите, чтобы раскрыть...

Я попытаюсь еще раз объяснить пользуясь аналогией.
Когда то был вымышленный 16-битный процессор Extel 666.
В его системе команд были только 16-битные слова. Регистры были (для простоты объяснения сейчас) только 16-битные и адресное пространство только 16-битное.
Было только два регистра A и B и были такие команды ассемблера:

Код (Text):

опкод E0: mov A, imm16

опкод E1: mov A, [B]

опкод E2: mov A, [imm16]

опкод E3: mov A, [B+imm16]

в последнем варианте логичнее называть imm16 смещением, т.к. мы как бы смещается относительно базы из регистра B. А в предпоследнем варианте скорее напрашивается addr16 - просто прямой адрес.
Но с точки зрения кодирования и то и другое это два байта адреса лежащие сразу за опкодом в памяти выполняемой программы.
Так или иначе addr16 покрывает всё возможное адресное пространство, поэтому он именно терминологически напрашивается как "адрес", хотя под капотом всё отличие в том, что не происходит суммирования с B.

Далее процессор делают 32-битным. 32-битные варианты регистров называются EA и EB. По умолчанию процессор работает в 32-битном режиме где все эти опкоды начинают работать как:

Код (Text):

опкод E0: mov EA, imm32

опкод E1: mov EA, [EB]

опкод E2: mov EA, [imm32]

опкод E3: mov EA, [EB+imm32]

Опять таки все варианты косвенной адресации продолжают охватывать всё адресное пространство, поэтому третий вариант инструкции это всё равно mov EA, [addr32] чисто по понятиям, а в четвёртом логичнее говорить об offs32, но технически это разница лишь терминологическая в языке.

Но с переходом на 64 бита создатели архитектуры решили, что слишком жирно все смещения делать 64-битными и сделали вот такой ход конём:

Код (Text):

опкод E0: mov RA, imm64

опкод E1: mov RA, [RB]

опкод E2: mov RA, [RIP+imm32]

опкод E3: mov RA, [RB+imm32]

Только команде загрузки непосредственного значения в регистр RA дали возможность иметь 64-битный immediate.
Но последние две команды где было смещение - там смещения оставили для экономии 32-битными. В 64-битном адресном пространстве E2: mov RA, [imm32] перестал иметь хороший смысл, поэтому его заменили на mov RA, [RIP+imm32]
Мы потеряли возможность написать mov RA, [любой_адрес_в_памяти].
Если хочется такое сделать, то придётся писать две инструкции:
mov RB, любой_адрес_в_памяти
mov RA, [RB] ; (с порчей регистра RB)

В общих чертах - по этой схеме развивалась архитектура i86 и отсюда все вышеозвученные проблемы помноженные еще на десяток сложностей которые есть в архитектуре настоящего процессора.
И вот поэтому если программа не уложилась в 2Гб нижних адресов ОЗУ линкер спасует перед её линковкой, т.к. не сможет родить правильный mov RA, [RIP+????] и тогда надо компилировать с опцией -mcmodel=large когда компилятор начнёт вставлять дополнительные инструкции чтобы обеспечить 64-битные смещения.

kol1978 · 21 фев 2025

MaKsIm сказал(а): ↑

Вот две инструкции загрузки в rax учетверенного слова по смещению
Посмотреть вложение 9616
И вот что из себя представляют их опкоды:
Посмотреть вложение 9618
0x48 это как раз REX.W префикс, дальше опкод 0xA1 или 0x8B и вот уже дальше все зависит от опкода инструкции: для 0xA1 идет просто 64-битное смещение указатель на ячейку памяти, а вот для 0x8B там уже присутствует байт modr/m, который расшифровывается как rip+offset32. Так получается, что данные идут сразу за этими двумя командами и значения разные, но адреса одни и те же.
Как можете видеть обе команды ссылаются на одну и туже переменную, но вот кодируются по разному.

--- Сообщение объединено, 21 фев 2025 ---

Вы разберитесь с терминами в документации intel. А вашем случае этот "адрес переменной" на самом деле оффсет от начала сегмента.

--- Сообщение объединено, 21 фев 2025 ---

Вот что по этому поводу говорит документация Intel
Посмотреть вложение 9619
Как можете увидеть для команды A1 в коде установлено использование moffs64 (memory offset 64-bit). Для команды с байтом mod reg, r/m надо смотреть таблицу декодирования этого байта и там мы увидим
Посмотреть вложение 9620
И тут мы видим сокращение disp (displacement), что можно перевести как отступ или смещение (offset)
Нажмите, чтобы раскрыть...

спасибо за ответ! просба : "Вы разберитесь с терминами в документации intel. А вашем случае этот "адрес переменной" на самом деле оффсет от начала сегмента." - давайте не будем друг другу давать указания типа : вы разберитесь. По сути понятно...и согласен, но не до конца проясняет ситуацию... - ответ на вопрос по коду: никак не скомпилировать бинарник 2 гига... - так?

Код (Text):

.text #расположение исполняемого кода

.globl main;

main: #точка входа

endbr64

pushq %rbp

movq %rsp, %rbp

movl $25, %edx

leaq message(%rip), %rax

movq %rax, %rsi

movl $1, %edi

call write

movl $0, %edi

call _exit

. = main + 2147483648 ##если ваши позиции не достаточно позиционны не меняйте цифру 2147483648, а если поменяете, то читайте GPL отказ от ответственности :)

.data

message:

.string " \345\215\220 \320\245\320\260\320\271\320\273\321\214 \320\241\320\270 \345\215\220"

иду на хитрость шутки что бы разрядить обстановку...

--- Сообщение объединено, 21 фев 2025 ---

aa_dav сказал(а): ↑

Я попытаюсь еще раз объяснить пользуясь аналогией.
Когда то был вымышленный 16-битный процессор Extel 666.
В его системе команд были только 16-битные слова. Регистры были (для простоты объяснения сейчас) только 16-битные и адресное пространство только 16-битное.
Было только два регистра A и B и были такие команды ассемблера:

Код (Text):

опкод E0: mov A, imm16

опкод E1: mov A, [B]

опкод E2: mov A, [imm16]

опкод E3: mov A, [B+imm16]

в последнем варианте логичнее называть imm16 смещением, т.к. мы как бы смещается относительно базы из регистра B. А в предпоследнем варианте скорее напрашивается addr16 - просто прямой адрес.
Но с точки зрения кодирования и то и другое это два байта адреса лежащие сразу за опкодом в памяти выполняемой программы.
Так или иначе addr16 покрывает всё возможное адресное пространство, поэтому он именно терминологически напрашивается как "адрес", хотя под капотом всё отличие в том, что не происходит суммирования с B.

Далее процессор делают 32-битным. 32-битные варианты регистров называются EA и EB. По умолчанию процессор работает в 32-битном режиме где все эти опкоды начинают работать как:

Код (Text):

опкод E0: mov EA, imm32

опкод E1: mov EA, [EB]

опкод E2: mov EA, [imm32]

опкод E3: mov EA, [EB+imm32]

Опять таки все варианты косвенной адресации продолжают охватывать всё адресное пространство, поэтому третий вариант инструкции это всё равно mov EA, [addr32] чисто по понятиям, а в четвёртом логичнее говорить об offs32, но технически это разница лишь терминологическая в языке.

Но с переходом на 64 бита создатели архитектуры решили, что слишком жирно все смещения делать 64-битными и сделали вот такой ход конём:

Код (Text):

опкод E0: mov RA, imm64

опкод E1: mov RA, [RB]

опкод E2: mov RA, [RIP+imm32]

опкод E3: mov RA, [RB+imm32]

Только команде загрузки непосредственного значения в регистр RA дали возможность иметь 64-битный immediate.
Но последние две команды где было смещение - там смещения оставили для экономии 32-битными. В 64-битном адресном пространстве E2: mov RA, [imm32] перестал иметь хороший смысл, поэтому его заменили на mov RA, [RIP+imm32]
Мы потеряли возможность написать mov RA, [любой_адрес_в_памяти].
Если хочется такое сделать, то придётся писать две инструкции:
mov RB, любой_адрес_в_памяти
mov RA, [RB] ; (с порчей регистра RB)

В общих чертах - по этой схеме развивалась архитектура i86 и отсюда все вышеозвученные проблемы помноженные еще на десяток сложностей которые есть в архитектуре настоящего процессора.
И вот поэтому если программа не уложилась в 2Гб нижних адресов ОЗУ линкер спасует перед её линковкой, т.к. не сможет родить правильный mov RA, [RIP+????] и тогда надо компилировать с опцией -mcmodel=large когда компилятор начнёт вставлять дополнительные инструкции чтобы обеспечить 64-битные смещения.
Нажмите, чтобы раскрыть...

отвечаю перефразированием :

leaq message(%rip), %rax является примером адресации относительно RIP (или относительно указателя команд).
При адресации относительно RIP процессор вычисляет эффективный адрес, используя содержимое регистра RIP и 32битное значение смещения со знаком, которое закодировано в команды.
пример команды mov rcx,–2000, которая загружает отрицательное непосредственное значение в RCX.
Машинный код для этой команды также использует 32 бита для кодирования непосредственного значения –2000, которое расширяется до 64 разрядов со знаком и сохраняется в RCX.
Одно незначительное ограничение относительной адресации RIP состоит в том, что операндприемник должен находиться в адресном окне ±2 ГБ относительно значения в регистре RIP.
Для большинства программ это условие редко имеет значение.
Адресация относительно RIP позволяет процессору ссылаться на глобальные или статические операнды, используя 32битное смещение вместо 64битного смещения, что уменьшает
пространство кода. Это также упрощает позиционнонезависимый код.
Нажмите, чтобы раскрыть...

- так? это имелось в виду? Тогда давайте избавимся от (%rip)..., но почему все равно не помогает?

aa_dav · 21 фев 2025

Movl offset message, esi сработает.
А после этого mov [esi], esi получит желаемое.
А инструкции которая грузит в регистр любой адрес в 64битной памяти в один присест просто нет.

TermoSINteZ · 21 фев 2025

aa_dav, есть
pop reg

TermoSINteZ · 21 фев 2025

kol1978 сказал(а): ↑

давайте не будем друг другу давать указания типа : вы разберитесь
Нажмите, чтобы раскрыть...

Вам последнее предупреждение.
В следующий раз в бан

kol1978 · 21 фев 2025

aa_dav сказал(а): ↑

Movl offset message, esi сработает.
А после этого mov [esi], esi получит желаемое.
А инструкции которая грузит в регистр любой адрес в 64битной памяти в один присест просто нет.
Нажмите, чтобы раскрыть...

ох... уж эти инструкции...ну допустим ведь для загрузки в сегментный регистр тоже нет одной команды...и приходится делать двумя - это не суть. Нужен пример доработанного кода... тогда будет понятно (Movl offset message - это не тот синтаксис который можно понять).

--- Сообщение объединено, 21 фев 2025 ---

опкод: mov A, [imm16] - здесь нет смещения/офсета

опкод : mov A, [B+imm16] - здесь imm16 это смещение. И! это синтаксис ассемблера... как там и о чём пишет интел

Мы немедленно приостановили все деловые операции в России. Это следует за нашим предыдущим решением приостановить все поставки клиентам в России и Беларуси.
Нажмите, чтобы раскрыть...

...пусть себе пишет... Здесь тоже есть слово смещение и это имеет право на существование, причем и то и другое:

два байта - это слово - адрес всего слова в памяти — адрес первого байта последовательности
Параграф - 16 байт памяти
нумерация параграфов - от 0 до 65535 по 16 байт = 1Мбайт
адрес параграфа - номер * 16
длинна сегмента - 4096 параграфов = 65536 = 64Кбайта
размеры сегмента нигде не указанны и огранченны относительной частью адреса
полный сегментный адрес - 0xHHHH:0xHHHH сегментная_часть:относительная_часть
сегментная_часть - номер параграфа с которого начинается сегмент
относительная_часть - определяет смещение адресуемого байта от начала сегмента т.е. номер байта
Нажмите, чтобы раскрыть...

MaKsIm · 21 фев 2025

kol1978 сказал(а): ↑

никак не скомпилировать бинарник 2 гига... - так?
Нажмите, чтобы раскрыть...

Дело не в этом. Бинарник может быть хотя 2, хоть 4 Гб. Вопрос только в том как вы будете добираться до переменных в этом бинарнике. Проблемы начинаются в месте где переменная располагается дальше чем 2Гб от команды, которая её использует. Этой проблемы нету при работе с регистрами напрямую для адресации переменных, но вот при вычислении адресов она может возникнуть. Ведь вам доступно много разных вариантов задания адресов. И вот один из них это как раз с использованием disp32 (видите, что в таблице нету вариантов с disp64). Вот когда в команде потребуется задать disp32 > 2Гб, тогда этого сделать будет нельзя. А вот из-за генерации PIC (Position Independent Code - Кода без привязки к адресам) т.е. использования в коде относительных адресов и регистра rip накладывает ограничение на объем адресуемых данных. Для обхода этого ограничения создаются специальные таблицы адресов переменных, которые точно можно будет использовать через rip+disp32, а сами эти таблицы содержат уже полный 64-битный оффсет для переменной, загружаемый в регистр общего назначения.

Но в разных форматах бинарников тоже есть разные механизмы создания PIC из обычного кода. В PE для перемещения кода есть секция fixups, которая содержит смещения всех команд в секции кода для обновления этих 32-битных значений после загрузки бинарника в память. И похожий на эту секцию сегмент в ELF тоже есть. Кажется он называется GNU_RELRO.

kol1978 · 21 фев 2025

MaKsIm сказал(а): ↑

Дело не в этом. Бинарник может быть хотя 2, хоть 4 Гб. Вопрос только в том как вы будете добираться до переменных в этом бинарнике. Проблемы начинаются в месте где переменная располагается дальше чем 2Гб от команды, которая её использует. Этой проблемы нету при работе с регистрами напрямую для адресации переменных, но вот при вычислении адресов она может возникнуть. Ведь вам доступно много разных вариантов задания адресов. И вот один из них это как раз с использованием disp32 (видите, что в таблице нету вариантов с disp64). Вот когда в команде потребуется задать disp32 > 2Гб, тогда этого сделать будет нельзя. А вот из-за генерации PIC (Position Independent Code - Кода без привязки к адресам) т.е. использования в коде относительных адресов и регистра rip накладывает ограничение на объем адресуемых данных. Для обхода этого ограничения создаются специальные таблицы адресов переменных, которые точно можно будет использовать через rip+disp32, а сами эти таблицы содержат уже полный 64-битный оффсет для переменной, загружаемый в регистр общего назначения.

Но в разных форматах бинарников тоже есть разные механизмы создания PIC из обычного кода. В PE для перемещения кода есть секция fixups, которая содержит смещения всех команд в секции кода для обновления этих 32-битных значений после загрузки бинарника в память. И похожий на эту секцию сегмент в ELF тоже есть. Кажется он называется GNU_RELRO.
Нажмите, чтобы раскрыть...

Спасибо за ответ! Тогда так : мною предлагалось не использовать PIC...но это не срабатывает (может только у меня...если да то предложите модификацию кода). Мною говорилось что ограничение 2 гига связанно с

ограничение создаётся 32-битным целочисленным ограничением (2 147 483 647),которое является максимально возможным целым числом, которое может быть представлено 32 двоичными цифрами.
Нажмите, чтобы раскрыть...

и тогда можно сказать что ЦП не истинно 64 битный а всего лишь 32...не зависимо от того сколько инструкций не поддерживают полностью 64 битный режим - с этим опять же не согласны и выдают за чушь...

В PE для перемещения кода есть секция fixups
похожий на эту секцию сегмент в ELF
Нажмите, чтобы раскрыть...

это не своевременно...и по этому не понятно. в ELF много всяких секций и разного кода который добавляется точно не самим программистом...- эта тема для другого поста.
По поводу таблицы: [edx]+ disp32 - это стало быть 32битный регистр прибавляется к 32битному числу и по итогу это 32битный операнд - т.е. это не полностью 64 битная инструкция и поэтому, процессор не полностью 64 битный - так можно сказать опираясь на ваше высказывание?

" Для обхода этого ограничения создаются специальные таблицы адресов переменных, которые точно можно будет использовать через rip+disp32, а сами эти таблицы содержат уже полный 64-битный оффсет для переменной, загружаемый в регистр общего назначения." - что это за механизм и как его можно использовать для при примера(команда; код)?

MaKsIm · 21 фев 2025

kol1978 сказал(а): ↑

По поводу таблицы: [edx]+ disp32 - это стало быть 32битный регистр прибавляется к 32битному числу и по итогу это 32битный операнд - т.е. это не полностью 64 битная инструкция и поэтому, процессор не полностью 64 битный - так можно сказать опираясь на ваше высказывание?
Нажмите, чтобы раскрыть...

Это не верно. Там вычисляется 64-битный адрес, но в инструкции нельзя напрямую добавить 64-битное смещение. Т.е. [rdx+disp32] и на выходе у вас 64-битный адрес, но относительно rdx можно добраться не более чем на 2 гб в обе стороны.

--- Сообщение объединено, 21 фев 2025 ---

kol1978 сказал(а): ↑

что это за механизм и как его можно использовать для при примера(команда; код)?
Нажмите, чтобы раскрыть...

Этот пример вам уже показывали
https://wasm.in/threads/svjazka-visual-c-2017-s-masm.35300/page-2#post-444298

kol1978 · 22 фев 2025

MaKsIm сказал(а): ↑

Это не верно. Там вычисляется 64-битный адрес, но в инструкции нельзя напрямую добавить 64-битное смещение. Т.е. [rdx+dsp32i] и на выходе у вас 64-битный адрес, но относительно rdx можно добраться не более чем на 2 гб в обе стороны.
Нажмите, чтобы раскрыть...

значит ограничение создаётся 32-битным целочисленным ограничением (2 147 483 647), которое является максимально возможным целым числом, которое может быть представлено 32 двоичными цифрами и это число dsp32i - это так ?
и именно при этом 64разрядный регистр заполняется нулями про сложении с dsp32i что бы сумма была 64 разрядной - так?

--- Сообщение объединено, 22 фев 2025 ---

--- Сообщение объединено, 21 фев 2025 ---

Этот пример вам уже показывали
https://wasm.in/threads/svjazka-visual-c-2017-s-masm.35300/page-2#post-444298[/quote]
Там какой то отвлеченный пример, кода на Си который будет компилироваться в любом случае. При этом используется флаг gcc -mcmodel=large -no-pie -Os -m64 hello.s -o hello (-mcmodel=large) и ничего об этом флаге не сказано...
И так код который нужно скомпилировать и который отвечает задачам/параметрам:

Код (Text):

.text #расположение исполняемого кода

.globl main;

main: #точка входа

endbr64

pushq %rbp

movq %rsp, %rbp

movl $25, %edx

leaq message, %rax

movq %rax, %rsi

movl $1, %edi

call write

movl $0, %edi

call _exit

. = main + 2147483648 ##если ваши позиции не достаточно позиционны не меняйте цифру 2147483648, а если поменяете, то читайте GPL отказ от ответственности :)

.data

message:

.string " \345\215\220 \320\245\320\260\320\271\320\273\321\214 \320\241\320\270 \345\215\220"

Я уже говорил что с применением флага -mcmodel=large тоже не получается скомпилировать...

--- Сообщение объединено, 22 фев 2025 ---

MaKsIm сказал(а): ↑

--- Сообщение объединено, 21 фев 2025 ---

Этот пример вам уже показывали
https://wasm.in/threads/svjazka-visual-c-2017-s-masm.35300/page-2#post-444298
Нажмите, чтобы раскрыть...

код на Си :

Код (Text):

extern int x;

int func()

{

return x + 1;

}

с флагом -O3 -std=c++23 -mcmodel=large
получает :

Код (Text):

func():

movabsl x, %eax

addl $1, %eax

ret

(https://godbolt.org/) как автор кода получал код ассемблера из примера по ссылке не уточняется...и вообще про синтаксис тоже умалчивается...

Так что вопрос повторяю - ?

aa_dav · 22 фев 2025

kol1978 сказал(а): ↑

как автор кода получал код ассемблера из примера по ссылке не уточняется...и вообще про синтаксис тоже умалчивается...
Нажмите, чтобы раскрыть...

У gcc/clang есть ключ компиляции -S который если указать вместо создания объектного файла (.o) или выполнимого файла создаст файл ассемблера (.S) который если потом компилировать, то получится ровно то же самое, что было из исходного файла. Т.е. всегда можно попросить компилятор объяснить во всех деталях какой машинный код он хочет создать и более того - ассемблерный код этот будет пригоден для дальнейшей компиляции с тем же результатом!

-mcmodel=large тоже не получается скомпилировать...
Нажмите, чтобы раскрыть...

Этот флаг влияет на поведение компилятора C/C++ - на то какой ассемблерный код он будет создавать из исходника на C/C++, но с готовым ассемблерным кодом он уже ничего делать не будет.

Там какой то отвлеченный пример
Нажмите, чтобы раскрыть...

Угу, потому что попытки объяснить на реальном примере провалились, поэтому была попытка объяснить на пальцах.

kol1978 · 22 фев 2025

Код (ASM):

.text

.section .text.startup,"ax",@progbits

.p2align 4

.globl main

.type main, @function

main:

.LFB12:

endbr64

.L2:

pushq %r15

movl $1, %edi

movl $25, %edx

movabsq $_GLOBAL_OFFSET_TABLE_-.L2, %r11

leaq .L2(%rip), %r15

movabsq $message@GOTOFF, %rax

addq %r11, %r15

leaq (%r15,%rax), %rsi

movabsq $write@PLTOFF, %rax

addq %r15, %rax

call *%rax

xorl %edi, %edi

movabsq $_exit@PLTOFF, %rax

addq %r15, %rax

call *%rax

. = main + 2147483648

.globl message

.data

.size message, 25

message:

.string " \345\215\220 \320\245\320\260\320\271\320\273\321\214 \320\241\320\270 \345\215\220"

компиляция :

Код (Text):

gcc -O3 -std=c++23 --no-relax -mcmodel=large hail.S -o hail_

то же самое - если изменить число 2147483648 на например 1147483648, то только в этом случает получается бинарник...
Вопрос актуален...

--- Сообщение объединено, 22 фев 2025 ---

aa_dav сказал(а): ↑

У gcc/clang есть ключ компиляции -S который если указать вместо создания объектного файла (.o) или выполнимого файла создаст файл ассемблера (.S) который если потом компилировать, то получится ровно то же самое, что было из исходного файла. Т.е. всегда можно попросить компилятор объяснить во всех деталях какой машинный код он хочет создать и более того - ассемблерный код этот будет пригоден для дальнейшей компиляции с тем же результатом!

Этот флаг влияет на поведение компилятора C/C++ - на то какой ассемблерный код он будет создавать из исходника на C/C++, но с готовым ассемблерным кодом он уже ничего делать не будет.

Угу, потому что попытки объяснить на реальном примере провалились, поэтому была попытка объяснить на пальцах.
Нажмите, чтобы раскрыть...

Хорошо! вот вам Сишный код получите из него ассемблер , создайте удаление для переменной(message) на 2гига и скомпилируйте - если ваше объяснение ("на пальцах") правильное это должно работать...:

Код (C):

#include <unistd.h>

char message[] = " \345\215\220 \320\245\320\260\320\271\320\273\321\214 \320\241\320\270 \345\215\220";

int main()

{

write(1, message, sizeof(message));

_exit(0);

}

Но! не работает...Жду ваш пример?

Войти или зарегистрироваться

связка Visual C++ 2017 с MASM

MaKsIm Active Member

aa_dav Active Member

MaKsIm Active Member

Intro Active Member

kol1978 Member

MaKsIm Active Member

kol1978 Member

MaKsIm Active Member

aa_dav Active Member

kol1978 Member

aa_dav Active Member

TermoSINteZ Синоби даоса Команда форума

TermoSINteZ Синоби даоса Команда форума

kol1978 Member

MaKsIm Active Member

kol1978 Member

MaKsIm Active Member

kol1978 Member

aa_dav Active Member

kol1978 Member

Войти или зарегистрироваться

связка Visual C++ 2017 с MASM

MaKsIm Active Member

aa_dav Active Member

MaKsIm Active Member

Intro Active Member

kol1978 Member

MaKsIm Active Member

kol1978 Member

MaKsIm Active Member

aa_dav Active Member

kol1978 Member

aa_dav Active Member

TermoSINteZ Синоби даоса Команда форума

TermoSINteZ Синоби даоса Команда форума

kol1978 Member

MaKsIm Active Member

kol1978 Member

MaKsIm Active Member

kol1978 Member

aa_dav Active Member

kol1978 Member

Быстрый поиск