3000$. Собрать максимально-производительную машину

Тема в разделе "WASM.HARDWARE", создана пользователем dyn, 4 окт 2010.

  1. W4FhLF

    W4FhLF New Member

    Публикаций:
    0
    Регистрация:
    3 дек 2006
    Сообщения:
    1.050
    qqwe, дело в том, что одна видюха может использоваться и как гпу и как видеокарта. Любой вызов процедуры на ГПУ (кернела) проходит через драйвер и на время работы кернела обновление видеобуфера блокируется, т.е. комп для пользователя "висит". Кроме того, если скажем на Win7 кернел будет работать больше 5 сек., то система (а именно т.н. watchdog timer) просто перезагрузит драйвер видеокарты и все расчёты пропадут.

    Существует три выхода:
    1. Увеличить время срабатывания этого таймера, либо отключить его вообще. Тогда расчёты будут вестись, а для пользователя комп будет "висеть".
    2. Вызывать кернел много-много раз в цикле на CPU, т.е. разбить весь блок вычислений на мелкие части и между запусками кернела драйвер видюхи будет обновлять видеобуфер. (именно так сделано во всех бруттерах).
    3. Не использовать графическую подсистему. Запускать и мониторить расчёты удалённо по SSH. Так работают многие, в том числе я. На ноуте стоит NVIDIA 9600GTS, на удалённом серваке под Debian x64 крутится 4 tesla карточки. Соответственно начальный вариант на маленьких объёмах пишется и отлаживается локально, а потом уже сборка и тестинг на удалённой машине.
     
  2. asmlamo

    asmlamo Well-Known Member

    Публикаций:
    0
    Регистрация:
    18 май 2004
    Сообщения:
    1.734
    слабый аргумент.

    Если человеку нужна высокая скорость вычислений то свои потребности он оплачивает сам.

    Не правильно помните. Там нет таких ограничений.
     
  3. W4FhLF

    W4FhLF New Member

    Публикаций:
    0
    Регистрация:
    3 дек 2006
    Сообщения:
    1.050
    По поводу масштабируемости и стоимости. GPU гораздо легче и дешевле масштабировать. Хотя бы то, что в обычный корпус можно втыкнуть 3 платы уже о многом говорит. Это удобнее и дешевле. Потому что собирать кластер на CPU может себе позволить не каждый и не каждый заказчик согласится на это.

    Скажем для одинарной точности, пиковая производительность современного Core i7 ~220 GFlops, GTX 480 1300 GFlops. Последний может работать на любом современном компе. Стоит 500 баксов. Решение на CPU обойдётся в любом случае дороже. Тут уже и обычный корпус не подойдёт и весьма экзотические комплектующие нужны (корпус, мамка, охлаждение). Вылетит в копеечку.

    Для наглядности:
    [​IMG]
     
  4. Booster

    Booster New Member

    Публикаций:
    0
    Регистрация:
    26 ноя 2004
    Сообщения:
    4.860
    qqwe
    Шутите? Как-бы неудачно.

    Гонево же, причём очевидное.
     
  5. qqwe

    qqwe New Member

    Публикаций:
    0
    Регистрация:
    2 янв 2009
    Сообщения:
    2.914
    asmlamo
    см пост выше
    --
    да нет. это очень сильный аргумент, тк вы сами себе противоречите. или сумма для вас самого бросовая или не требуйте от других чтобы они ей бросались. каждый любит и жалеет свои собственные деньги точно также как и вы.
    нуну. всем нам надо очень много, но не слышал я чтоб ктото просто так разбрасывался деньгами. особенно на дело.


    W4FhLF
    то бишь для куды нет разницы между количеством карт и их поколениями? те дополнительных телодвижений при смене оси, смене/добавлении гпу нет? это еще интереснее.

    хорошо, а дрова с поддержкой гпу есть и под вынь и под линь, но открытых для порта нет?

    -------------
    кстати, чтото я слышал о использовании шэйдеров для расчетов на видюхах. их поддержка более встречается. что скажете насчет этого момента?
     
  6. Booster

    Booster New Member

    Публикаций:
    0
    Регистрация:
    26 ноя 2004
    Сообщения:
    4.860
    qqwe
    Что ты хочешь? ГПУ в не конкуренции по соотношению цена/производительность. Если заказчик хочет сэкономить, то он будет экономить. Что ещё?
     
  7. Booster

    Booster New Member

    Публикаций:
    0
    Регистрация:
    26 ноя 2004
    Сообщения:
    4.860
    >кстати, чтото я слышал о использовании шэйдеров для расчетов на видюхах. их поддержка более встречается. что скажете насчет этого момента?
    Шейдеры предназначены для рендера, для расчётов они слишком ограничены. Но тут нужно смотреть конкретную задачу. Например шедейры на старых картах не умеют работать с целыми числами, а это существенный минус. А те что умеют, умеют и производить расчёты, но без лишнего гемороя.
     
  8. qqwe

    qqwe New Member

    Публикаций:
    0
    Регистрация:
    2 янв 2009
    Сообщения:
    2.914
    W4FhLF
    сетевой грид делается просто. хотя, тут очень сильно зависит от требований. но поддержать несколько 100тен тысяч компов в гриде никакая не проблема.
    вся настройка будет заключаться в указании регистратора и выдаче задания.

    (снова говорю - тут все очень сильно зависит от задачи. если задача совсем не параллелится, то не судьба)
    не пойму я зачем вам чтото экзотическое. все обычное и половина лишнего. и можно вообще ничего не покупать.

    Booster
    к чему относится ваша реплика и какой в ней смысл?
     
  9. Booster

    Booster New Member

    Публикаций:
    0
    Регистрация:
    26 ноя 2004
    Сообщения:
    4.860
    qqwe
    Это ваша реплика. А означает она то, что ничего ждать не надо. Understand?
     
  10. W4FhLF

    W4FhLF New Member

    Публикаций:
    0
    Регистрация:
    3 дек 2006
    Сообщения:
    1.050
    qqwe
    Когда существует более одного устройства GPU (т.е. multiGPU), то утилизация всех ресурсов это уже задача разработчика. Можете распределять вычисления согласно производительности каждого из устройств или избрать другую стратегию. Один из мои знакомых, работающий в NVIDIA, как раз разрабатывает API для гибридных (multi-GPU + multi-CPU) асинхронных (поскольку I/O операции на GPU и вычисления могут выполнятся абсолютно параллельно) систем.

    Что касается совместимости, то, скажем, CUDA 3.2 поддерживает карты поколения начиная от 9x-GT200-GF100, т.е. всё, что выходило последние 3 года. Поэтому просто ставите новый драйвер и работаете.

    Кстати на GPU уже DDR5 вовсю юзают.

    Дрова есть для Win/Linux/MacOS причём как 32, так и 64 версии. Открытых нет, да это и ненужно. Я работал с CUDA на системах XP-Vista-Win7-Debian-Fedora. Везде всё как часы пашет. В отличии от OpenCL скажем :)

    Ну это использовали лет 5-6 назад. Собственно это был предшествующий CUDA/OpenCL этап. Причём там серьёзные ограничения были. Короче это удаление гланд через ж**у.
     
  11. spa

    spa Active Member

    Публикаций:
    0
    Регистрация:
    9 мар 2005
    Сообщения:
    2.240
    qqwe
    с логикой явные проблемы, явные.
     
  12. Booster

    Booster New Member

    Публикаций:
    0
    Регистрация:
    26 ноя 2004
    Сообщения:
    4.860
    W4FhLF
    Никто не заставляет отказываться от куды. Можно использовать куду + brook, в зависимости от вендора. Но OpenCL всё же предпочтительнее для портируемости.
     
  13. qqwe

    qqwe New Member

    Публикаций:
    0
    Регистрация:
    2 янв 2009
    Сообщения:
    2.914
    Booster
    я написал - все зависит от цели этого проекта. если проект пишется для широкой аудитории, то решение на гпу не может быть единственным, тк у среднего пользователя с высокой вероятностью гпу нет и необходимость выложить свои деньги на покупку еще одной _видеокарты_ он не поймет и воспримет в штыки. в точности как в опыте выше. или он будет считать периодическое подвисание картинки оч серьезным недостатком.

    а вы мне принялись доказывать, что гпу считать умеет. я знаю это.

    насчет цена/производительность я не знаю. конкуренты по производительность есть, а по ценам я выборки не делал.
    пример, как использовать шейдеры для обычных расчетов проссылить можете? меня как раз плавучка и интересует.
     
  14. Booster

    Booster New Member

    Публикаций:
    0
    Регистрация:
    26 ноя 2004
    Сообщения:
    4.860
    qqwe
    Cейчас цена на видеокарту поддерживающую General-Purpose computation, бюджетна. И пользователь без оной это пользователь в криокамере.

    Посмотрите здесь - http://gpgpu.org/. Хотя насчёт именно использования шейдеров не скажу.
    Но принцип там до безобразия тупой и надо сказать тормозной. Передаём текстуру или группу текстур в пиксельный шейдер, в пиксельном шейдере считываем данные с этих текстур, делаем обработку в шейдере, рендерим в другую текстуру, и в конце считываем эту текстуру в оперативную память.
     
  15. qqwe

    qqwe New Member

    Публикаций:
    0
    Регистрация:
    2 янв 2009
    Сообщения:
    2.914
    W4FhLF
    те, это возлагается на прогу - заметить наличие дополнительных гпу, учесть их возможности и ограничения и выдать им задания? немного сложно. например, для гпу стоящего как видеокарта, видимо, надо учитывать вочдог.
    хотя, в принципе, те же телодвижения, что и для грида.
    на видюхи всегда память побыстрее ставили. хотя, это зависит от карты. на нотах память разделяемая и будет тормозить даже больше, чем предполагается из типа.
    почему не нужно?
    это верно, но массовый потребитель идет не на гребне прогресса. и шэйдерные расчеты счас сможет подхватить большинство без необходимости обоснования дополнительных капиталовложений. в отличие от гпу. в чем их и ценность.

    spa
    кокие именно?
     
  16. W4FhLF

    W4FhLF New Member

    Публикаций:
    0
    Регистрация:
    3 дек 2006
    Сообщения:
    1.050
    Не, ну если пользователю сообщить, что видюха за 300 баксов позволит перекодировать ему фильм за 3 часа вместо 20 обычных, то просто при следующем апгрейде он вместо нового проца купит видюху. Каждый конечно исходит из своих задач. А поскольку все алгоритмы которые сегодня реализуются для GPU изначально были реализованы на CPU, то ессно поддержка обычных процессоров никуда не девается.
     
  17. asmlamo

    asmlamo Well-Known Member

    Публикаций:
    0
    Регистрация:
    18 май 2004
    Сообщения:
    1.734
    Вот что бы не раззбрасываться деньгами нужно покупать GPU ибо это дешевле в 10 раз.

    GPU именно и покупают для экономии.

    480 - стоит 500$

    i7 300-500$


    Но для того той же производительности как у 480 нужно купить 5-6 i7 а это выйдет 3000$
     
  18. Booster

    Booster New Member

    Публикаций:
    0
    Регистрация:
    26 ноя 2004
    Сообщения:
    4.860
    Я свою HD 3850, год назад, брал за 3 тыс деревянных, и она мне позволяет смотреть HD фильмы с последними кодеками вполне комфортно. Так что это вполне доступно.
     
  19. W4FhLF

    W4FhLF New Member

    Публикаций:
    0
    Регистрация:
    3 дек 2006
    Сообщения:
    1.050
    Да, поддержка multiGPU это программная часть. Я бы не стал здесь говорить о гриде, по-скольку это более высокий уровень абстракции. Например, вы в курсе, что сегодня самый мощный суперкомпьютер (китайчеги собрали полгода назад) на GPU? Это тоже грид, где вычислительный узел -- это GPU.

    На шейдерах просто невозможно реализовать задачи массового "потребления", если речь не про графику.
     
  20. asmlamo

    asmlamo Well-Known Member

    Публикаций:
    0
    Регистрация:
    18 май 2004
    Сообщения:
    1.734
    С чего вы это решили ?

    Я вам давал ссылки ...

    А что там собственно говоря обосновывать ?

    Ускорение расчетов в 10-20 раз за разумные деньги.

    А там уж пользователь пусть сам решает. Мож там скряга на хламе i386 сидит.