пришёл AVX 3.1 и AVX 512 -> MMX, SEE, 3DNAW на мусорку

Тема в разделе "WASM.ASSEMBLER", создана пользователем VaVa, 17 дек 2019.

?

как кто думает ?

  1. Intel просто стебётся

    2 голосов
    50,0%
  2. всё в порядке вещей (всё оптимизировано)

    1 голосов
    25,0%
  3. всё в порядке вещей (всётаки монополия)

    0 голосов
    0,0%
  4. Монополия стала загнивать ... сейчас увидим ...

    2 голосов
    50,0%
Можно выбрать сразу несколько вариантов.
  1. VaVa

    VaVa Member

    Публикаций:
    0
    Регистрация:
    21 авг 2018
    Сообщения:
    34
    как-то команд для векторных вычислений развелось как грязи...
    причем когда-то на старых компах когда только появлялся SEE то инструкции MMX стали выполнятся за не вменяемо большее количество тактов...
    1)массивы чисел и на видюхе можно посчитать...
    2)никто даже обычно не включает опцию использования AVX в компиляторах (только в отдельных случаях чтоб ПО не запустилось)

    как кто думает ... может Intel просто стебётся?
    --- Сообщение объединено, 17 дек 2019 ---
    ещё инфа для размышления
    http://rsdn.org/article/pl1/pl1ex12/pl1ex12.xml?print
     
  2. UbIvItS

    UbIvItS Well-Known Member

    Публикаций:
    0
    Регистрация:
    5 янв 2007
    Сообщения:
    6.087
    ну-почему, векторные регистры на проце крайне полезны даже на скалярных задачах, ибо можно их пользовать для кэширования переменных. А ваще идёт неминуемое слияние цпу и гпу в единый юнит (в большинстве случаев это будет приводить к ощутимому бусту). надо ещё отметить, что действительно векторные регистры приводят к ренессансу Асма (автоматика пишет коды под вектора крайне ущербно) :) впрочем, под вр вполне можно писать либы для облегчения сией ситюёвины, хотя.. хотя.. хотя :)
     
  3. Intro

    Intro Active Member

    Публикаций:
    0
    Регистрация:
    29 авг 2009
    Сообщения:
    562
    Кстати, при массовом использовании AVX проц просаживает частоту, так что сложно сказать об реальной эффективности AVX по сравнению с SSE. Если 3д вектор double, то да, AVX хорош, а если сделать оптимизацию, x и y вычисляем SSE2, а z FPU, то скорость будет немного меньше в AVX.
     
  4. Indy_

    Indy_ Well-Known Member

    Публикаций:
    4
    Регистрация:
    29 апр 2011
    Сообщения:
    4.775
    Intro,

    Не тестил, но следует не забывать что это очень большая часть контекста, перезагрузка которого включается при использовании NPX. Цикл замера профайла должен быть быстрым, что бы исключить планирование.
     
  5. UbIvItS

    UbIvItS Well-Known Member

    Публикаций:
    0
    Регистрация:
    5 янв 2007
    Сообщения:
    6.087
    в общей производительности аппа частота проца не играет особо существенной роли == он и так быстрей озу в разы.
     
  6. Indy_

    Indy_ Well-Known Member

    Публикаций:
    4
    Регистрация:
    29 апр 2011
    Сообщения:
    4.775
    Предлагаю потестить, снять профайл. Что бы не гадать как обычно.
     
  7. UbIvItS

    UbIvItS Well-Known Member

    Публикаций:
    0
    Регистрация:
    5 янв 2007
    Сообщения:
    6.087
    любые примеры будут локальными. а тестить много сэмплов на разных процах, осях, озу == МУТОРНО :) но можешь взять для начала уже имеющиеся тестилки https://www.tomshardware.com/reviews/stress-test-cpu-pc-guide,5461-2.html