Ustus Забыл пояснить насчет data conflict в P4. Из прочтения мануала можно сразу не понять при чем тут линейные адреса, т.к. во всех "нормальных"...
Ustus Видимо, да ;) Загляни еще раз в IA-32 Optimization в раздел General optimization...\Memory...\...Aliases in Caches или проще поиском "Data...
SWR Сомнительное утверждение, т.к. в х86-64 размер операнда по умолчанию по прежнему = 32 бита, а 64-битные операнды, если в них нет...
Пример "resource constraint" и как добавление инструкции может уменьшать время исполнения. Пытаемся реализовать зигзаг-перетасовку вордов на...
Mika0x65 Это throughput = 1, т.е. можно выдавать запросы на чтение в каждом такте, и соответственно данные будут приходить в каждом такте, но с...
Описка вышла ;) Дело в том, что в IA-32 L=4 и T=1, а у Фога L=3 и T=2 Спрашивается кому верить ? Сначала мне на вскидку показалось, что прав Фог,...
Предисловие: Эпиграф: Краткое содержание 3-й серии с подстрочным переводом: throughput - 2 такта latency - 3-4 такта для r32, для m16 как...
xlinuks Необязательно, просто нужно понимать что к чему ;) mov [dwMessageAddr+2], 97 означает запись по адресу offset dwMessageAdr+2, т.е. в...
v_mirgorodsky Проверил - риплей присутствует даже на хваленых Prescott'ах, не говоря уже о Northwood'ах. Убери грабли (например, измени адреса...
CyberManiac Как я уже сказал у max=256 есть разумное обоснование - set of char. Не ограничивать вообще ес-но нельзя, т.к. нерадивые "школьники"...
И грамотные, и ушлые и не пытаемся искать тайный смысл в словах, написанных на заборе ;)) Ты выдернул цитату из раздела терминологии performance...
CyberManiac, IceStudent Множество в 256 элементов занимает 256/8=32 байта памяти - уже не хило, но оправдано для упрощения операций с set of char....
arccos(x) = arctan(sqrt(1-x*x)/x) => юзаем fsqrt и fpatan проверка на x = 0 не нужна, а вот при |x| > 1 получим исключение на fsqrt ;a = arccos(x)...
v_mirgorodsky P6 = {P-Pro, PII, PIII, Pentium M, Core, Core 2} ИМХО, это просто-напросто недокументированная фича P4 - на Northwood'ах RDTSC...
asmfan Тут вроде о NetBurst "базар" идет, а не о P6 :))) К тому же не стоит впадать в крайности - не все так сложно и непредсказуемо, но и не...
М-да, крик души, да и только ;) "Из своего личного опыта" - обычно такие революционные заявления заканчиваются в стиле "у-пс, ошибочка вышла :(("...
Формулировка задаваемых вопросов наводит на мысль, что автор мягко говоря не учитывает того, что непрерывный диапазон виртуальных адресов "обычной...
Читаем А.Фога и мануалы по оптимизации от Intel и AMD (к сожалению или к счастью все на английском :)) Никакого особого творчества тут не...
Aleus Essentia А почему в файлах Fibonachi.exe и FibonachiAsm.exe из первого аттача выравнивание одинаковое - может ты один и тот же файл под...
alpet В данном случае exe-образы практически идентичны - секция кода точно один ко одному, остальное - на вскидку Поэтому дело только в...
Имена участников (разделяйте запятой).