можно ли сделать так, чтобы процесс занимал не более n(+-5) процентов CPU, даже если остальное достанется idle?
leo 8 блоков обрабатывается примерно так Rnew[0] = r1[0] | (r2[0] <<8) | (r3[0] <<16) ... ... Rnew[7] = r1[7] | (r2[7] <<8) | (r3[7]...
leo Заменил в твоем варианте mov edx,[SBIn] mov eax,[SBIn+4] на movd edx, mm0 punpckhdq mm0,mm0 movd eax, mm0 и...
В принципе да, можно сделать в таблице tXlat в нижнем байте нормальное значение, в верхнем - перемешанное. Тогда минус перемешивание, но плюс...
leo Sorry, неверно выразился. SBout, полученный по таблице, используется и напрямую, как вход для перемешивания. Вот реализация этого куска...
leo Этак мы по всему коду пройдемся :) После загрузки в mm7 значение SBOut более не нужно, а вот в mm7 оно нужно на вход _do????. В...
S_T_A_S_ movq mm7, SBOut movq mm0, BC1Out6 pxor mm0, mm7 movq BC1Out6, mm0 Этот код нельзя заменить на обычные регистры. Все...
leo Регистров MMX используется не просто много, они используются все :). В той процедурке, которую я вопросиками пометил, заюзаны остальные....
leo Каюсь, посыпаю голову пеплом... Я же тестовый проект в MSVS делал, а у него хватило интеллекта сохранять/восстанавливать изменяемые...
Что конкретно сделать CodeAnalyst'ом? Он у меня есть, только правильно пользоваться им я пока не научился. Да и Athlon у меня живет меньше месяца....
leo Я тут поменял материнку и слегка разогнал процессор, так что результаты чуть ушли. Но важно соотношение а не общий показатель. Моя/твоя...
bogrus Ой плохо себя повела shrd на AMD :) Вставлено в предыдущий тест. Время - 3156 мсек.
leo Да, все так и есть. Причем, в твоем исполнении звучит очень понятно, не то что в доках AMD :) Еще бы с учетом этого код оптимизировать....
bogrus Тут я с тобой согласен. Правда, с некоторыми оговорками. Во первых, основной таргет - АМД. Во вторых, доиа то у меня все равно другого...
bogrus Вставил в проект, попробовал. Стало медленнее. Все-же читать сразу 32 бита в регистр и сдвигать его оказалось быстрее, чем читать эти...
ash Время на выполнение твоего варианта соотносится со временем моего примерно 4:3. Хочу отметить, что сдвигать налево и ORить я пробовал, чтобы...
psw1 у меня больной алгоритм, практически весь на MMX, исходник на асме уже около 120 килобайт Ветвлений там нет совсем, даже циклы...
crypto Возникает такое ощущение, что байтовые комады "эмулируются" работой с целыми 32битными регистрами и маскировкой. Во всяком случае, даже...
psw1 Точной статистики по этой конкретной процедуре у меня нет, но производительность алгоритма в целом существенно падает.
Исходные данные: 1. Есть DIn размером 8 байт либо в памяти либо в регистре MMX, на выбор. 2. Есть таблица tXlat 256 элементов размером 1...
Имена участников (разделяйте запятой).