Компилятор генерирует неоптимальный код.

Тема в разделе "LANGS.C", создана пользователем W4FhLF, 19 дек 2008.

  1. W4FhLF

    W4FhLF New Member

    Публикаций:
    0
    Регистрация:
    3 дек 2006
    Сообщения:
    1.050
    Прошу прощение за долгое отсутствие. Не было времени вернуться к проблеме.

    Спасибо всем за советы, в особенности leo. Простое транспонирование второй матрицы позволило увеличить производительность примерно на порядок.

    Но, единственный момент. Эмпирически было установлено, что нет особого смысла в такой оптимизации при размерах матриц меньше ~300x300.
     
  2. leo

    leo Active Member

    Публикаций:
    0
    Регистрация:
    4 авг 2004
    Сообщения:
    2.542
    Адрес:
    Russia
    Ес-но, поскольку матрица B умещается в кэш