Оптимизация для процессоров семейства Pentium: 4. Отладка — Архив WASM.RU
Отладка ассемблерного кода может оказаться довольно трудоемкой и неприятной, как вы, возможно, уже заметили. Я рекомендую вам сначала написать то, что вы хотите оптимизировать как подпрограмму на языке высокого уровня. Затем напишите тестовую программу, в которой вы будете отлаживать подпрограмму. Убедитесь, что тестовая программа удовлетворяет всем условиям ветвления и выравнивания.
Затем переведите код на язык ассемблера.
Теперь вы можете начать оптимизировать. Каждый раз, когда вам нужно сделать изменения, вы будете переходить к тестовой программе, чтобы убедиться, что она работает. пронумеруйте все ваши версии и сохраните их, чтобы вы могли в случае ошибки вернуться к ним.
Протестируйте скорость наиболее критичных частей вашей программы с помощью метода, изложенного в главе 30 или с помощью тестовой программы. Если код значительно медленнее, чем ожидалось, тогда возможно, что: неправильно используется кэш (глава 7), невыравненны операнды (глава 6), цена первого запуска (глава 8), неправильное предсказание переходов (глава 22), проблемы загрузки кода (глава 15), потери скорости при чтении регистра (глава 16) или долгая цепь зависимости (глава 20). © Агнер Фог, пер. Aquila
Оптимизация для процессоров семейства Pentium: 4. Отладка
Дата публикации 22 авг 2002