Ustus В догонку к fast ALU. Что меня действительно неприятно удивило в свое время, это то, что логика выполняется только на ALU_0. Отсюда иногда...
Ustus А чего удивляться, я постом выше выдал опус и без всякого удивления ;)
l_inc Нет именно зависимых, т.к. независимые могут и параллельно на разных блоках выполняться, а зависимые только последовательно. Но за счет...
ZEQ Я бы еще добавил мусорного ;) К чему тут movzx и push\pop - для обфускации ?! :))) Деление на 255 для чисел < 256^2 add ax,bx movzx...
l_inc С "плюс время ожидания", т.к. throughput отсчитывается с момента запуска инструкции на исполнение, а не ее окончания. Issue port - это порт...
ZEQ, l_inc Это смотря что понимать под латентностью push\pop. Для современных процев полную латентность указывают только AMD - у них обе операции...
Perre Ну и в чем тогда проблема ? Читаешь файл блоками пока ReadFile возвращает true и dwBytesReaded = dwBytesToRead (или как их там ; ). Дату и...
CreatorCray Мда, хотел я на простом примере отделаться, а с этими cmov пришлось целое исследование замутить. Пол дня убил фиг знает на что ;)...
Ну что, горячие финские парни, выговорились ;) Начнем с того, что код UbIvItS, вовсе не "канонический" и никакого _bit_scan_reverse тут делать не...
cppasm Как показал Great в #8 компилятор может быть еще тупее ;)) А в Оле нужно искать не "sub al,48", а по крайней мере "sub R8,30" т.к. и...
asmfan А что значит "нет" ? Первый раз при lpvAddress = Null память выделяется и освобождается нормально - и VirtualFree возвращает OK и...
Угу, но компилятор не понял твоих замыслов и затолкал все переменные в стек :))) Кроме регистров нужно еще эффективно использовать порты запуска...
Skevalt Во-во ;) Разворот основного цикла на 6 даже при правильной реализации является избыточным, а в приведенном сишном варианте выглядит...
Не знаю как там в ядре, а в ntdll большинство Rtl\Nt-функций начинается именно так - вызывается стандартная функция, которая ставит SEH, выполняет...
REALiSTiC Это частное решение, т.к. без GlobalLock работать будет только при условии, что строка в буфере была выделена в куче 1) твоего процесса...
REALiSTiC Еще раз повторяю для бестолковых - GetClipboardData возвращает не указатель на текст, а хэндл перемещаемого блока памяти. Чтобы получить...
Mikl__ Да нет, т.к. AAM корректно делит только AL, т.е. EAX < 256, а у твоего варианта допустимый диапазон еще меньше, так что о делении EAX...
Про GlobalLock не забудь, иначе в еах будет не указатель на строку, а хэндл HGLOBAL
Хорошо иметь под рукой таблички латентностей от А.Фога и IA-32 Optimization, плюс до кучи AMD Optimization'ы по Athlon XP и 64. Тогда без проб и...
Имена участников (разделяйте запятой).