Сделаем MS компилятор лучше =)

semen · 4 апр 2005

Некоторые недоделки MS компилера уже достали =) Особенно обидно, потому что компилер неплохой, где-то лучше gcc, где-то хуже.

Проголосуйте за suggestion, если не трудно:

http://lab.msdn.microsoft.com/productfeedback/viewfeedback.aspx?feedba ckId=9390d202-2fb0-419d-acee-0fbfc6e38881

там я написал недочеты, что щас вспомнил. Объясняю зачем это надо: как я понял, если за suggestion проголосовал 1 человек - то MS его вовсе не рассматривает (что спорно - мало кто вотит за других, тока если при создании нашелся аналогичный suggestion), если 2 - то оно где-то в конце списка и рассмотрение будет не скоро думаю все понятно...

Broken Sword · 4 апр 2005

вот такое - "...but can`t remember when it happens" они точно смотреть не будут

semen · 4 апр 2005

Broken Sword

Ты почитай - там и не такое пишут (тем более в профиле английскими буквами написано, что я русский - мне можно . А вообще я конечно не мастер такие вещи постить(как было так и написал - своими глазами видел конструкцию eax->e?x->eax, но тогда к сожалению не сохранил это дело никуда)... Покрайней мере я сделал все что смог... Если кто умеет лучше - можно еще один создать, поидее гении из MS должны их объединить.

PS: так и не проголосовал зря считаешь это бесполезным делом...

PS2: а вообще, если ругать, то за опечатку "somedimes", которую уже не исправить.

Broken Sword · 4 апр 2005

semen

мне просто довелось как-то месячишко проработать в quality assurance company, так там даже за это время на составление всевозможных баг-репортов натаскали до такой степени, что теперь составленные любительским способом отчеты вызывают негодование ). Нужно четко указывать последовательность действий, которые приводят к ошибке и еще кучу ньюансов указывать. Я не фанат этого дела, но в данном случае даже не понятно какие именно улучшения ты предлагаешь (я так понял - тебе не нравиться как он оптимизирует - так от этого не уйдешь, это субъективные все вещи)

semen · 5 апр 2005

Broken Sword

Ну дык, для того чтоб узнать все точно надо аттач скатать(в 2000 символов н уложился - там все точно написано, где он поступает неверно, и что надо сделать - надо тока прочесть все. Тока совсем по-хорошему надо каждый глюк в отдельный suggestion. Но я же не в "quality assurance" работаю и времени у меня тоже не вагон, пусть спасибо скажут, что хоть так на ляпы указал. И я привел случаи не где "не нравиться как он оптимизирует", а те, где компилер откровенно тупит. Ты вообще аттач смотрел? Там-же все с asm листингами. Так что считаю твои претензии необоснованными - скажи конкретно в каком примере из аттача я не прав и компилер не тупит, а ведь почти во всех случаях убрать глюк не составит труда, а _movss - это вообще баг, мелкий но баг. Лучше бы помог тогда нормальный suggestion составить, если работал в quality assurance company...

Broken Sword · 5 апр 2005

semen

до аттача не дошел, каюсь.

semen · 5 апр 2005

Broken Sword

если с __assume и логикой все четко, то с intrinsic засада, наскока я пока понял глюк происходит из-за того, что компил фиксирует хмм регистр, положим xmm0 для __m128 переменной, после неких вычислений результат положим сформировался в xmm1, но компил все равно переложит результат в выделенный xmm0, несмотря на то, что сформировать результат в xmm0 небыло труда. Выхода 2 - не фиксировать регистр, как GPR и формировать результат где надо(т.е не фиксировать неявные присвоения). Но в момент поста я еще об этом не знал - просто видел что это тупизм и с GPR таких ляпов нет. С неправильной оптимизацией выноса _mm_setzero_ps() за цикл тоже все четко.

Dr.Golova · 5 апр 2005

> Некоторые недоделки MS компилера уже достали =) Особенно обидно, потому что компилер неплохой

Если достали, то используй Intel C компилер, интеловцы уж точно знают как оптимизировать код под свои камни. По моим тестам на крипто-библиотеках (целочисленные операции) прирост скорости от тупого рекомпайла достигал 20%, а при активном использовании в проекти fpu это были разы. Убожище GCC сосет причмокивая одним словом.

S_T_A_S_ · 5 апр 2005

У меня на AES прирост в скорости у intel'а = 50%. что самое интересное, размер кода одинаков в MSVC =)

Однако, Intel C компилер тоже иногда откровенно тупит - вместо mov eax, esp делает lea eax, esp. Наверное, чтобы на атлонах работало медленнее %) И для вещей вроде memcpy для блоков в пару байт вызывает внешнюю функцию из либы %) в то время, как MSVC делает простой movds.

Tim Sobolev · 5 апр 2005

Есть еще модуль к MSVC под названием Vector C... Я игрался с ним, там можно получить очень оптимизированный код по размеру или скорости...

semen · 5 апр 2005

Dr.Golova

Про интел компилер я знаю и тоже его юзаю и в свое время на интел тоже постил репорты, но и он не идеален, по тупизму примерно равен MS и 50% различия никогда не позволял, всегда добивался примерно равной скорости без применения асма. Для интела есть еще недостаток, что надо гораздо больше контролировать то что делает компилятор, например иногда совершенно разные ключи компиляции необходимы для разных файлов проекта или давать указания #pragma везде, например что этот кусок векторизировать не надо - иначе будет перфоманс дроп. Ну и остальное про что говорил Стас. MS в этом отношении лучше - не делает лишнее, хотя в 8й студии компил уже больше походит на интел - кискификатор вырезали, что плохо. А вообще интел(8.1.018) прошел все тесты что я запостил, кроме __assume и logic_test. intrinsic, logic_test1 и logic_test2 прошли на ура, с чем не справился MS. Короче удалить эти ляпы (ну и может быть внести векторизатор, но только для PGO) и MS будет рулить. Да, чуть не забыл - интел платный, а VS2005Tools можно юзать свободно, хотя деньги вобщем небольшие.

Убожище GCC сосет причмокивая одним словом.
Нажмите, чтобы раскрыть...

Версию gcc и ключи компиляции в студию.

Tim Sobolev

Очень интересно, что за Vector C?

S_T_A_S_ · 5 апр 2005

semen >

MS в этом отношении лучше - не делает лишнее
Нажмите, чтобы раскрыть...

Ну это не всегда так - он бывает начинает тупо разворачивать циклы где не нужно, и единственный известный мне способ его вразумить - __asm nop в нужном месте :/

>

50% различия никогда не позволял, всегда добивался примерно равной скорости без применения асма
Нажмите, чтобы раскрыть...

В моём случае это не реально - MSVC интенсивно пихает в/из памяти промежуточные данные, а Intel лучше обходится недостаточным для алго количеством регистров. Мои попытки улучшить код привели к увеличению корости и там и там хотя сильно не старался

VS2005Tools - это Express Beta? У меня постоянно IDE падает =) Да и юзать его свободно для коммерческого использования нельзя.

semen · 5 апр 2005

S_T_A_S_

Ну это не всегда так - он бывает начинает тупо разворачивать циклы где не нужно, и единственный известный мне способ его вразумить - __asm nop в нужном месте :/
Нажмите, чтобы раскрыть...

Ну дык интел это делает куда активнее. Кстати именно для этого и нужен __assume c <, > - чтоб без PGO указать компилеру что разворачивать ничего не надо, в аттаче там есть такой тест - __assume с радостью хинт глотает, но не юзает, пашет тока == и !=.

В моём случае это не реально - MSVC интенсивно пихает в/из памяти промежуточные данные, а Intel лучше обходится недостаточным для алго количеством регистров. Мои попытки улучшить код привели к увеличению корости и там и там хотя сильно не старался
Нажмите, чтобы раскрыть...

Ну тут ничего не могу сказать - мне всегда удавалось. Может ты юзаешь не тот MS компилер? У меня v14.00.41115.19

VS2005Tools - это Express Beta? У меня постоянно IDE падает =) Да и юзать его свободно для коммерческого использования нельзя.
Нажмите, чтобы раскрыть...

Нет VS2005Tools это тока компилятор без ИДЕ, но бесплатно и можно юзать в коммерческих целях...

PS: так никто и не проголосовал - чтож все такие ленивые...

S_T_A_S_ · 6 апр 2005

Про "разворачивание" я наврал чуток, уточняю:

Код (Text):

while( 1 )

{

do_someting();

if( its_time ) break;

do_someting_else();

}

Такой код преобразуется к

Код (Text):

do_someting();

while( ! its_time )

{

do_someting_else();

do_someting();

}

Это не всегда хорошо, т.к. может отрицательно сказаться на скорости (про размер молчу).

>

VS2005Tools это тока компилятор без ИДЕ
Нажмите, чтобы раскрыть...

Это что ли Visual C++ 2005 Tools Refresh? не могу найти ничего на их сайте :-(

у мя 13.10.х.з.

semen · 6 апр 2005

S_T_A_S_

ИМХО все верно она делает - это оптимизация для P4 - чтоб не делать в цикле бранч вперед, при этом если цикл не нулевой то все переходы статически предскажутся верно:

Код (Text):

#include <stdio.h>

volatile int its_time;

void do_someting()

{

printf("a\n");

}

void do_someting_else()

{

printf("b\n");

}

void f()

{

while( 1 )

{

do_someting();

if( its_time ) break;

do_someting_else();

}

}

/*

?f@@YAXXZ PROC ; f, COMDAT

; Line 19

push OFFSET ??_C@_02LDEEGPHA@a?6?$AA@

call _printf

; Line 20

mov eax, DWORD PTR ?its_time@@3HC ; its_time

add esp, 4

test eax, eax

jne SHORT $LN12@f

$LL3@f:

; Line 21

push OFFSET ??_C@_02LBACNBCJ@b?6?$AA@

call _printf

push OFFSET ??_C@_02LDEEGPHA@a?6?$AA@

call _printf

mov ecx, DWORD PTR ?its_time@@3HC ; its_time

add esp, 8

test ecx, ecx

je SHORT $LL3@f

$LN12@f:

; Line 23

ret 0

?f@@YAXXZ ENDP ;

*/

Без такой оптимизации прескотту будет не сладко

S_T_A_S_ · 6 апр 2005

semen >

чтоб не делать в цикле бранч вперед
Нажмите, чтобы раскрыть...

это же выход из цикла по условию! он и так будет предсказан как not taken.

Код (Text):

?f@@YAXXZ PROC

l00p:

push OFFSET ??_C@_02LDEEGPHA@a?6?$AA@

call _printf

mov eax, DWORD PTR ?its_time@@3HC

add esp, 4

test eax, eax

jne SHORT $LN12@f

$LL3@f:

push OFFSET ??_C@_02LBACNBCJ@b?6?$AA@

call _printf

mov ecx, DWORD PTR ?its_time@@3HC

add esp, 8

test ecx, ecx

je l00p

$LN12@f:

ret 0

?f@@YAXXZ ENDP

и там не всё так просто: do_someting() - это большая куча кода, а не call. и этот цикл крутится в другом. в результате "оптимизации" падение скорости 10% (начинает ещё интенсивнее хранить промежуточные результаты в памяти). intel не делает такой бесполезной лабуды.

semen · 6 апр 2005

S_T_A_S_

Да, ступил - предсказание тут не причем. И все же в твоем случае 2 бренча во внут. цикле вместо одного - короче тут надо как-то решение пренимать - надо это делать или нет, но все-же это оптимизация - иначе перфоманс будет падать в другом случае - когда это маленький и критичный цикл. А вот критерий выбора видать подкачал или его вообще нет...

Кстати MS поступает точно так-же как интел в случае ключа /Os:

Код (Text):

?f@@YAXXZ PROC ; f, COMDAT

; Line 20

jmp SHORT $LN11@f

$LL3@f:

; Line 21

call ?do_someting_else@@YAXXZ ; do_someting_else

$LN11@f:

; Line 19

call ?do_someting@@YAXXZ ; do_someting

; Line 20

mov eax, DWORD PTR ?its_time@@3HC ; its_time

test eax, eax

je SHORT $LL3@f

; Line 23

ret 0

?f@@YAXXZ ENDP ;

Короче это уже из раздела как компилятор должен правильно принимать решения, а не из раздела ляпов о коих идет речь в suggestion.

PS: это не ты проголосовал и поставил 4? Походу лучше не голосовать чем 4 ставить - рейтинг стал хуже...

S_T_A_S_ · 6 апр 2005

semen

Никак не могу увидеть каких-то приимуществ - бранчей всегда 2 - условный и безусловный. Разве что при каких-то загадочных условиях код за меткой $LN12@f в моём примере может оказаться не в кэше при джампе на него .

/Os не решение - будет ещё медленнее.

Короче, IMHO, это не ляп, а design flow =)

ЗЫ: я ещё не проголосовал, жутко всё тормозит на их сайте с моим инетом. буду чегонибуть качать - проголосую

semen · 7 апр 2005

S_T_A_S_

Кхм, может я опять туплю, но в случае MS внутри цикла бранч один:

Код (Text):

$LL3@f:

; Line 21

push OFFSET ??_C@_02LBACNBCJ@b?6?$AA@

call _printf

push OFFSET ??_C@_02LDEEGPHA@a?6?$AA@

call _printf

mov ecx, DWORD PTR ?its_time@@3HC ; its_time

add esp, 8

test ecx, ecx

je SHORT $LL3@f

Так что в оптимизации смысл есть - тока что проверил - быстрее...

S_T_A_S_ · 7 апр 2005

semen

Да, действительно, получается меньше на бранч. Но прирост в скорости от выкидывания одной инструкции - довольно сомнительная вещь. В случаях, когда в цикле всего пара команд лишний джамп может и влияет (хотя, иногда, "лишняя" инструкция может увеличить скорость - в случае P6 из-за портов, например).

А когда в цикле пара тысяч инструкций - этот джамп не будет заметен.

И вот делая "полуразвёртывание" цикла компилер ещё лишнюю тыщу добавляет. У компилера из-за этого как раз проблемы и начинаются - он плохо соображает что в каком регистре хранить на больших линейных участках кода. Ты же сам писАл про подобные проблемы с XMM регистрами.

Войти или зарегистрироваться

Сделаем MS компилятор лучше =)

semen New Member

Broken Sword Robert

semen New Member

Broken Sword Robert

semen New Member

Broken Sword Robert

semen New Member

Dr.Golova New Member

S_T_A_S_ New Member

Tim Sobolev New Member

semen New Member

S_T_A_S_ New Member

semen New Member

S_T_A_S_ New Member

semen New Member

S_T_A_S_ New Member

semen New Member

S_T_A_S_ New Member

semen New Member

S_T_A_S_ New Member

Войти или зарегистрироваться

Сделаем MS компилятор лучше =)

semen New Member

Broken Sword Robert

semen New Member

Broken Sword Robert

semen New Member

Broken Sword Robert

semen New Member

Dr.Golova New Member

S_T_A_S_ New Member

Tim Sobolev New Member

semen New Member

S_T_A_S_ New Member

semen New Member

S_T_A_S_ New Member

semen New Member

S_T_A_S_ New Member

semen New Member

S_T_A_S_ New Member

semen New Member

S_T_A_S_ New Member

Быстрый поиск