Есть P4 и Cel. Оба работают на частоте 2.4 Ггц. Насколько я понимаю ядро у них одно и тоже ? Т.е. с точки зрения асма это один и тот же проц. который понимает MMX,SSE2 и т.д. ? Различие только в обьеме кеша на кристалле ? А у XEON и еще и частоте работе кеша ? Если это так то какие различия в методах оптимизации проги на асме для P4 и Cel ? И не понятно различие в производительности у них. Если моя прога допустим занимает 16 Кб то она целиком попадает в Кеш Cel то различий в производительности не будет по идее ?
asmlamo Ну прога все равно не попадает - у P4 кеш кода 12k микроинструкций а не килобайт. Но главное, что ты наверняка не посчитал и все данные что прога использует. И еще: кеш сильно влияет на производительность.
У Cel нет hyper threading, меньше кеш L2. У XEON кеш большой, но он уровня L3, значит частота все-таки меньше. Может кто про XEON раз"яснит : чем он лучше ?! К тому же XEON теперь двух видов : дешевый с раз"емом 621 ( мог наврать) и дорогой под SLOT-? Дорогой ,я так понял, под многопроцессорные системы - он теперь буквами MP маркируется в прайсах.
У Celeron шина памяти в 2 раза медленнее, поэтому он иногда тормозит - это такой маркетинговый ход, дабы покупали PIV =) Зеоны может иногда и не лучше, но дороже - была afaik модель полностью идентичная PIII, тока в другом корпусе. Это же trademark просто такой, их вариантов много, но изначально вроде как отличались бОльшим L2 и/или наличаем L3 кэша.
Ну ты и наврал Xeon продаётся под один разъём - Socket604, все они предназначены под многопроцессорные системы, а буквами MP макрировались атлоны(не 64) для многопроцессорных конфигураций. У целеронов в четыре раза меньше кэш 2-ого уровня, меньше ассоциативность этого кэша(влияет на скорость его работы), нет Hyper threading, в два раза медленнее fsb, и вообще это обрезок полный Не завидую тем, у кого они установлены.
> iirc первый Зеон (ядро P6) был под Slot2. Выпускалось 3 модификации: L2 = 512, 1024, 2048 Кб. Первый из них отличался от P2 только тем, что кеш работал в 2 раза быстрее.
У целеронов в четыре раза меньше кэш 2-ого уровня, меньше ассоциативность этого кэша(влияет на скорость его работы) Ты уточни для каких задач и насколько влияет ? , нет Hyper threading, Он есть не у всех моделей P4 - а посему это не аргумент ! в два раза медленнее fsb, А подробнее можно ? и вообще это обрезок полный Это эмоции ... Нужны факты и цифры. Не завидую тем, у кого они установлены. У меня он стоит и дома и на работе. Вполне доволен.
Размер и ассоциативность кэша влияет на программы, которые работают с потоками данных. Например архивирование, кодирование звука и видео и игры. Насчёт HT - без него P4 уже не производятся, это были модели на 133mhz шине. fsb это обмен с памятью. У целеронов обмен с памятью с два раза медленнее чем у P4. И ещё говоришь это не обрезок. У этих процессоров одинаковая производительность: Athlon64 2.0Ghz, Athlon XP 2.3Ghz, PIV 3.2Ghz, Celeron D(на ядре prescott с 256kb кэшем) на частоте 3.8Ghz. А про обычные целероны я и не говорю, нет данных, наверное им нужна частота около 4.4 - 4.8Ghz, чтобы достичь этого уровня.
dragon >Насчёт HT - без него P4 уже не производятся, это были модели на 133mhz шине. HT появился с модели Pentium частота+буковкаC. Вот например выдержка из прайс-листа: Intel Pentium 4 2.8A 2800 MHz 533MHz 1 Mb Socket 478 oem (Prescott, 90нм) - у данной машины HT нет! Ибо буковка A .
HT есть и у процев, где нет буквы С, суффикс вводится именно для случаев, когда есть несколько разных моделей с одинаковой частотой. По поводу FSB: согласно заявлениям самой intel (!) нет никакого смысла увеличивать частоту ядра, когда она уже больше чем FSB в 6-7 раз - прирост производительности будет крайне низкий. Конечно процы такие всё равно выпускают - as market requires. Хотя на практике бывает что скорости PIV и Celeron оказываются одинаковы - например, когда приложения не оптимизированы. А таких случаев очень много, учитывая сколько прог откомпилированы Delphi =) Ещё, если прога хорошо оптимизирована по скорости, то HT врядли будет помогать - хорошо ещё, если кеш не будет портить часто.
Ну хорошо реальный пример. Допустим есть прога на ASM 4 Кб. Брутефорсом перебирает пароли к чему-то там. Есть P4 и Cel - Тактовая одинаковая. Насколько P4 будет работать быстрее для этой задачи ? У меня такие подозрения что разница будет смехотворна.
Hyper threading - ИМХО больше маркетинг чем реальная польза от него ... по крайней мере для обычного юзверя и его оффисных задач.
asmlamo Точннее всего будет просто проверить Если задача чисто вычислительная - миниум кода и данных - то думаю разницы не будет, если латентность L1 тоже одинаковая.
asmlamo > Во, давно бы так . IMHO разницы никакой не будет, если тока проверка пароля не сводится к вызову 8Mb "левого" кода