1. C MMX совсем другая история. Например итаниумовский pcmp - n паралелльных вычитаний с сохранением битовых флагов в регистре - где тут связь...
1. Ты все пытаешься расщепить выполнение на 2 ветви в случае зависимости. Сколько можно повторять что это сделать не выйдет. Я так и не придумал -...
1. Да ну? В современных процах ~3 такта тока кумекать будет в L1 данные или нет, а если в L2? то 20. А если память - то вообще хана....
alpet Истиный паралелелизм - это неколько ИУ + обвязка. Хипертрединг например - не истиный параллелелизм, верно? Правильно ли я понял...
alpet ОК, если что-нибудь еще раскопаешь напиши. Можешь выложить то, чем ты сканируешь процесс?
alpet Ну дык запусти тред с dwStackSize равным 30 метрам - что возможно вижал студия и делает =). Скорость низкая - из-за вызова исключения...
alpet 1. Ну об этом уже говорили - параллельное вычисление 2х веток без сильных накладных расходов не выйдет, так что от сталла никуда не...
1. Так я и не понял до конца, такая схема или нет ^^, про сталл с недозволеными понятно. У тебя всегда будет сталл при зависимости по данным от...
alpet 1. Значить примерно так: системные, бранчевые и работающие с памятью инструкции мы исключаем из числа дозволенных с условным префиксом(ты...
alpet Ну так стек если линейно читать - то тоже фолт будет - разрастание стека типа. Вот я и подумал... Тока вот он вниз растет - возможно...
alpet А это не стек ли? При линейном чтении - разрастается, скока тредов - стока и регионов, многократное чтение уже без задержек...
alpet 1. Насколько я понял, ты собрался параллельно обе ветки исполнять на oneq - на это надо 2 конвеера и 2 комплекта исп. устройств, что явно...
alpet Уууу - зря думаешь что можно не волноваться. Интел вот как раз усилия делает чтоб один набор исп. устройств нагрузить, а ты хочешь двойной...
alpet Аааа, вот оно как. Ну чтож, успехов в реализации новой архитектуры, может я и не прав и сделать это удастся. И все же я до сих пор считаю...
1. Мля - ну будет пенальти, будет что так что так см. прошлый пост. В итаниуме что ты привел в качестве примера нет отката выполнения и пенальти...
alpet А зачем это делать для х86, если можно просто тогда оптимизировать прыжок через инструкцию, обойдясь меньшими затратами площади кристалла?...
alpet 2. Я к тому что сделать префиксные команды скорее всего не получится, можно выбрать несколько наиболее нужных инструкций для внесения, без...
1. Конечно давно изобретено. Я просто указывал на ляпы х86, которых нет в других архитектурах. Про совместимость аболютно верно - потому я и писал...
alpet 1. Они полезны, для разрешения зависимостей, а когда мы увеличиваем число GPR, как в большинстве риск архитектур, и распараллеливаем...
alpet ну да =) но если бесполезные теперь теневые регистры флагов преобразовать в GPR то баланс восстановится =) короче не расчитывал я что...
Имена участников (разделяйте запятой).