Привет. Предистория. Есть один и тот же алгоритм написанный на MMX и на обычных командах. Захотелось померять прирост производительности,...
Обработка изображений, сжатие/распаковка jpeg. Там же написано было :) Профилировщик это - AMD CodeAnalyst. Ещё есть Intel VTune если интересно -...
Нет, не во время запуска. Я меряю до окончательной сборки и потом в зависимости от результатов выставляю приоритет используемых реализаций. Неа....
По барабану. И то и другое будет медленно. Я так и делаю. Точнее почти так :) Для разных реализаций замеряется число тактов по RDTSC и проверка...
Для тех кто на бронепоезде. 3DNow! используется только если при старте был обнаружен процессор AMD с поддержкой 3DNow!. Если нет 3DNow! но есть...
Программа одна - в ней разные ветки кода выполняются в зависимости от того на каком процессоре запущено. А вообще я не сторонник подхода "у всех...
Затем что SSE не у всех есть. У меня например на Duron нету, зато есть 3DNow!, 3DNow! Ext, MMX, MMX Ext. Поэтому код пишется в нескольких...
И ещё вопрос что такое FPU Scheduler Ineligible. В справке нигде описания нету :( [img]
Ты спалился :) Пользуешся FireFox. Там ссылки кривые, слэши от балды понаставлены в перемешку. Например:...
Ну да, декодируются по 3. Но чтобы выполнялось по три за такт это практически не реально. FADD и FMUL обрабатывают кучу операций за счёт наличия...
Вопрос уже не совсем по оптимизации... Копаюсь тут в CodeAnalyst. Зметил у себя в коде в паре мест следующую картину: Stall due to reservation...
Честно сказать я не допёр :) Смотрю инструкций 5, пишут про шесть, вроди все DirectPath, так что в микрооперациях тоже не сходится - думал...
Я знаю, и что? Блин :/ Заработал CodeAnalyst. Только я что-то с ним разобраться не могу. Он что без отладочной информации файлы не обрабатывает?...
Та нет. AMD64 Optimization Manual, ст. 228 В описании примера оптимизации: [img] Ну если за 15 тактов может быть выполнено 60 fpu команд, то я...
Чего за FNOP такой? На картинках в мануале AMD нет такого, там только три исполнительных устройства. Есть у меня подозрение что это из-за того что...
Что-то я зачастил :) Вопрос к тем кто разбирался с архитектурой AMD. В соответствии с ихними мануалами процессор может одновременно выполнять до 4...
Через int 15h надо карту памяти получать. DPMI хоста может и не быть. А если он всё-же есть - он хукает int 15h и правит результаты в соответствии...
leo спасибо ;) Я собственно так и думал, но в мануалах нигде точного описания этого момента не нашёл. Да, насчёт этого я в AMD Athlon x86 Code...
murder наверное хотел сказать что paddd надо? :)
Ну тогда просто так моё решение :) Основано на том что -X = Инверсия(X)+1 ; mm0 - input data pxor mm1,mm1 ; mm1 = 00000000 000000000 pcmpgtd...
Имена участников (разделяйте запятой).