1. Если вы только начинаете программировать на ассемблере и не знаете с чего начать, тогда попробуйте среду разработки ASM Visual IDE
    (c) на правах рекламы
    Скрыть объявление

Прикладной SIMD 002: краткий обзор

16 фев 2018

Предисловие Данная статья ставит целью в первую очередь рассказать хронологию появления тех или иных технологий SIMD в процессорах семейства x86 и одновременно кратко охарактеризовать их. Предыстория: FPU Изначально процессоры 8086 и 8088 (как более дешёвая версия 8086 с восьмибитной шиной данных) имели шестнадцатиразрядные регистры общего назначения и предоставляли возможность вычислений с использованием только целочисленной арифметики. Тем не менее в процессорах был предусмотрен набор...
Читать далее
Лайков +3 Комментариев6 Просмотров2.098

Прикладной SIMD 001: введение (часть 3)

16 фев 2018

Специфика программного кода Учитывая то, что плагины в первую очередь разрабатываются для использования в некоторой DAW (Digital Audio Workstation, цифровая звуковая рабочая станция), фреймы принято делить на отдельные моно-каналы. Благодаря этому значительно упрощается их коммутация, обработка и микширование в DAW (далее будет использоваться более общий и употребимый термин — хост (host)). Иными словами, стереоканал — это просто совокупность из двух моно-каналов. Каждый канал ассоциируется...
Читать далее
Лайков +2 Комментариев1 Просмотров783

Прикладной SIMD 001: введение (часть 2)

16 фев 2018

Анатомия сэмпла Разобравшись с частотой дискретизации и минимальной разрядностью сэмпла для нужд профессиональной аудиообработки, необходимо решить ещё один вопрос: каким образом семпл будет храниться в памяти. Как уже ранее упоминалось, для дискретизации по уровню сигнала может быть использована как линейная, так и нелинейная шкала. Нелинейная шкала была введена в цифровой телефонии для того, чтобы расширить динамический диапазон сигнала, но при этом сэкономить на размере сэмпла. На рисунке...
Читать далее
Лайков +1 Комментариев1 Просмотров833

Прикладной SIMD 001: введение (часть 1)

16 фев 2018

Предисловие Всем привет! Меня зовут Владимир Садовников, и в последнее время я активно занимаюсь разработкой плагинов, осуществляющих цифровую обработку аудиосигналов (DSP, Digital Signal Processing) на процессорах архитектуры x86 и x86_64. Учитывая то, что такие плагины зачастую осуществляют обработку сигнала в реальном времени, приходится достаточно основательно заниматься вопросом оптимизации вычислительных алгоритмов. При этом, одним из основных приёмов оптимизации является написание...
Читать далее
Лайков +3 Комментариев3 Просмотров1.170

Страничная адресация: PAE

16 окт 2007

В статье рассматривается режим страничной адресации PAE.
Читать далее
Лайков 0 Комментариев0 Просмотров757

Советы и рекомендации по программированию процессоров Intel® Pentium® 4

30 июн 2006

Многие считают, что для повышения производительности программ, выполняющихся на процессорах Intel® Pentium® 4, нужно использовать инструкции Streaming SIMD Extensions (SSE) и Streaming SIMD Extensions 2 (SSE2). В большинстве случаев так оно и есть. Действительно, с помощью инструкций SSE2 и 128-битных регистров XMM обычно можно значительно повысить производительность приложения. Но с другой стороны, если программа использует 64-битные данные, и их упаковка в 128-битные регистры не повышает эффективность, то стоит не тратить время на SSE или SSE2, а поискать другие способы оптимизации.
Читать далее
Лайков 0 Комментариев0 Просмотров527

Процессор изнутри. Часть 4: AMD64

9 мар 2005

Процессор Athlon-64 является первым массовым 64-разрядным процессором для настольных систем. За счет этого он немного выбивается из ряда всех рассматриваемых нами процессоров. Но поскольку он предоставляет средства мониторинга производительности, было бы неуважением по отношению к AMD обойти его вниманием.
Читать далее
Лайков 0 Комментариев0 Просмотров575

Процессор изнутри. Часть 3: AMD

15 фев 2005

В данной части мануала наконец-то дошла очередь и до AMD. Описание ведется по стандартной схеме – интерфейс, кэш, ядро, мониторинг производительности. Данная статья относится именно к Athlon и частично к Athlon XP. Частично, потому что блок-схемы практически совпадают, но у XP больше событий, чем в «просто Athlon». Дополнительные события будут рассмотрены в следующей части.
Читать далее
Лайков 0 Комментариев0 Просмотров638