cresta, ты как убедился что мой вариант работает правильно ? Результаты на PIII:94 исходный вариант bogrus 44 первый вариант cresta...
cresta Возможно я тебя не понял, а ты меня ;) А умножение байта на 08040201h раскидывает биты по разным тетрадам с инверсией порядка. Перед...
А че мы за рекордами по тикам гоняемся ;) Может симпатичный цикл сделать на 4 байта: ;push edi, push ebx mov edi,bin_str mov...
cresta > "Тут мысль одна появилась - не по полбайта обрабатывать, а побайтно" Гениально ! И умножение на 08040201h позволяет это...
cresta А ты еще считаешь пеньки капризными ;) Кол-во инструкций одинаково, зависимость по данным одна и та же, так неужели на Атлоне...
cresta > "может есть такое, чтобы байты разворачивало" Конечно, запиши в обратном порядке - получишь разворот ;) ;в eax 4 значащих бита...
Еще один стандартный вариант не гонять циклы - это использовать WaitMessage после OnIdle, т.е. отработали и отдали управление системе пока не...
Имхо основная разница в том, что GetMessage не возвращает управление программе пока не появится сообщение, а PeekMessage возвращает управление...
SDragon, спасибо, хорошая ссылочка Просмотрев кучу методов из указаной статьи, я прихожу к таким выводам: 1) Основных идей не так много и...
bogrus К твоему последнему варианту: 1) lea ecx,[ecx*8] + add ecx,ecx можно заменить на shl ecx,4 т.к. на P4 lea с масштабированием не...
cresta > На Атлоне это получается 53 тика Вот видишь, значит Атлон тоже не "любит" shld. У каждого семейства свои прибамбасы. Поэтому...
Если в в последнем симпатичном варианте bogrus'а убрать shld, то наверное всех устроит ;) По крайней мере на P3 без потерь, а на P4 - 68 тиков...
Догадайтесь с 3х попыток какой вариант быстрее на P4 ;)196 второй вариант cresta (P4 страшно не любит bswap и не долюбливает shl - лучше add ;)...
cresta > А как ты реализовал „супервариант captain cobalt “? По простому ;) ;push edi, push esi, pus ebx lea edi,[eax+32] mov ecx,-32...
bogrus Насчет eax, пардон. А говоришь тупой вариант, это я тупой сразу не сообразил ;) Насчет ~70 тиков на PIII. Если без call\ret и c...
bogrus Тупость только в том, что ты eax забыл обнулить :)) А вообще в данном случае тупой вариант ИМХО самый простой и компактный, а зачем тут...
cresta На P4 твой оптимизированный вариант fts1 дает выигрыш ~5-10% по сравнению с fts, причем особой зависимости выигрыша от положения...
Ага, ты и до NtGlobalFlag добрался ;) А чего сам-то не проверишь ? Ежели там 70h стоит - флаги enable heap-checking в соответствии с учением...
> "А свою причесаную процедуру что не показываешь?" Торопился, да еще ляпу сделал и в итоге результаты чересчур преукрасил :( В...
Да, более 4 повторяющихся символов в конце строки для недоделанного варианта dw_scan2 это плохо. А все из-за дурных прыжков внутрь цикла @r0..@r2....
Имена участников (разделяйте запятой).