bogrus Ну если осторожно, то и на P4 (модели <= 2) можно. Для тестирования циклов вполне можно юзать, при условии, что общая задержка получается...
bogrus С нашими "попугаями", выдаваемыми wintest.exe есть некоторые проблемы на P4: 1) На популярных моделях 15.2.x (Northwood) оверхед...
Я конечно в очередной раз "тормознул" и насовал во все варианты and cl,31, хотя все это делается автоматом в SHR. Пришлось подправить предыдущий...
bogrus > "всё намного сложнее, но понять можно и замеры проводить можно" Как говориться - "можно если осторожно", если с умом, с научным...
Ну вот, помозговал малость. Вычитание ecx-32 по условию это излишество, т.к. SHR берет CL по модулю 32. Вот еще несколько вариантов как обойти...
Вот такой вариантик с SETcc пришел на ум (Pos = 0..63) delta: dd 0, 32 .................................. xor eax,eax cmp ecx,32 setge al...
SteelRat В приведенном коде явно лишнее: 1) clc не нужно (на P4 очень медленная) 2) после shr никакие переходы не нужны, если Pos в...
bogrus > "значит неправильно считает оверхэд на 28 тактов для P4 " 1. Возможная причина того, что на P4 твой wintest.exe дает overhead <> 0 в...
С округлением до ближайшего значения есть одна хитрость: в соответствии со стандаротом IEEE, если число лежит ровно посередине между двумя...
memega см.PS к предыдущему посту
Способ округления в FPU зависит от установки RC-флагов в control word. По умолчанию RC = 00b, т.е. округление к ближайшему значению...
S_T_A_S_ Вот, вот, я тоже в конце концов набрел на этот рул. И чуть дальше тоже четко сказано: "Software should avoid writing to a code page in...
bogrus > "не всегда, но часто отбирает за 5000 тиков" На P4 твои тесты, что "eax", что "mmx" съедают более 4500 тиков на всех проходах !!!...
bogrus > "Вот максимум, что мне удалось накрутить" Да у меня на P3-800 (модель 6.8.6) тоже твой вариант дает 9 тиков без выравнивания и 8 тиков...
volodya > "Не, ну я уже злиться начинаю..." И правильно, меня так это просто бесит. И дело не в ереси, а в наглости, с какой человек, имея...
SolarWarez > стала быстрее.., стала медленнее... Чем такое объяснить ? 1) возможно некорректными замерами: влиянием окружающего "оформления",...
В варианте bogrus "притаилась" ошибочка. Стоит взять min1 < max1-Num1 и получим неверный результат. Этот вариант можно использовать если вместо...
Чего там у Кнута, к сожалению и стыду своему, не знаю. А вот в дельфях используется такой способ возведения base в целую степень exponent...
> "Почему переход такой медленный" А о каком процессоре идет речь ? Во-первых, на пентиумах задержка непредсказанного перехода сравнима с...
Понял. Оптимизация по скорости здесь конечно под большим вопросом (впрочем как и по коду). Так что давай "замнем" на этом для ясности.
Имена участников (разделяйте запятой).