3000$. Собрать максимально-производительную машину

W4FhLF · 6 окт 2010

qqwe, дело в том, что одна видюха может использоваться и как гпу и как видеокарта. Любой вызов процедуры на ГПУ (кернела) проходит через драйвер и на время работы кернела обновление видеобуфера блокируется, т.е. комп для пользователя "висит". Кроме того, если скажем на Win7 кернел будет работать больше 5 сек., то система (а именно т.н. watchdog timer) просто перезагрузит драйвер видеокарты и все расчёты пропадут.

Существует три выхода:
1. Увеличить время срабатывания этого таймера, либо отключить его вообще. Тогда расчёты будут вестись, а для пользователя комп будет "висеть".
2. Вызывать кернел много-много раз в цикле на CPU, т.е. разбить весь блок вычислений на мелкие части и между запусками кернела драйвер видюхи будет обновлять видеобуфер. (именно так сделано во всех бруттерах).
3. Не использовать графическую подсистему. Запускать и мониторить расчёты удалённо по SSH. Так работают многие, в том числе я. На ноуте стоит NVIDIA 9600GTS, на удалённом серваке под Debian x64 крутится 4 tesla карточки. Соответственно начальный вариант на маленьких объёмах пишется и отлаживается локально, а потом уже сборка и тестинг на удалённой машине.

asmlamo · 6 окт 2010

потому что вы утверждали, что это смешная, практически незаметная сумма.
Нажмите, чтобы раскрыть...

слабый аргумент.

Если человеку нужна высокая скорость вычислений то свои потребности он оплачивает сам.

нет. я не помню точно как именно оно там ограничено.
Нажмите, чтобы раскрыть...

Не правильно помните. Там нет таких ограничений.

W4FhLF · 6 окт 2010

По поводу масштабируемости и стоимости. GPU гораздо легче и дешевле масштабировать. Хотя бы то, что в обычный корпус можно втыкнуть 3 платы уже о многом говорит. Это удобнее и дешевле. Потому что собирать кластер на CPU может себе позволить не каждый и не каждый заказчик согласится на это.

Скажем для одинарной точности, пиковая производительность современного Core i7 ~220 GFlops, GTX 480 1300 GFlops. Последний может работать на любом современном компе. Стоит 500 баксов. Решение на CPU обойдётся в любом случае дороже. Тут уже и обычный корпус не подойдёт и весьма экзотические комплектующие нужны (корпус, мамка, охлаждение). Вылетит в копеечку.

Для наглядности:

Booster · 6 окт 2010

qqwe

если у вас стоит 2 видюхи с гпу, то 1 используется как видео, а 2 как гпу.
если у вас стоит 1 видюха с гпу, то она используется как видео.
Нажмите, чтобы раскрыть...

Шутите? Как-бы неудачно.

осталось только дождаться когда все это выйдет из зеленой юности, а гпу перестанет цепляться за видеокарты, а перейдет как и фпу в свое время в разряд обязательных сопроцессоров.
Нажмите, чтобы раскрыть...

Гонево же, причём очевидное.

qqwe · 6 окт 2010

asmlamo

нет. я не помню точно как именно оно там ограничено.
Нажмите, чтобы раскрыть...

Не правильно помните. Там нет таких ограничений.
Нажмите, чтобы раскрыть...

см пост выше

W4FhLF сказал(а):

дело в том, что одна видюха может использоваться и как гпу и как видеокарта. Любой вызов процедуры на ГПУ (кернела) проходит через драйвер и на время работы кернела обновление видеобуфера блокируется, т.е. комп для пользователя "висит". Кроме того, если скажем на Win7 кернела будет работать больше 5 сек., то система (а именно т.н. watchdog timer) просто перезагрузит драйвер видеокарты и все расчёты пропадут.
Нажмите, чтобы раскрыть...

--

потому что вы утверждали, что это смешная, практически незаметная сумма.
Нажмите, чтобы раскрыть...

слабый аргумент.
Нажмите, чтобы раскрыть...

да нет. это очень сильный аргумент, тк вы сами себе противоречите. или сумма для вас самого бросовая или не требуйте от других чтобы они ей бросались. каждый любит и жалеет свои собственные деньги точно также как и вы.

Если человеку нужна высокая скорость вычислений то свои потребности он оплачивает сам.
Нажмите, чтобы раскрыть...

нуну. всем нам надо очень много, но не слышал я чтоб ктото просто так разбрасывался деньгами. особенно на дело.

W4FhLF

Существует три выхода:
1. Увеличить время срабатывания этого таймера, либо отключить его вообще. Тогда расчёты будут вестись, а для пользователя комп будет "висеть".
2. Вызывать кернел много-много раз в цикле на CPU, т.е. разбить весь блок вычислений на мелкие части и между запусками кернела драйвер видюхи будет обновлять видеобуфер. (именно так сделано во всех бруттерах).
3. Не использовать графическую подсистему. Запускать и мониторить расчёты удалённо по SSH. Так работают многие, в том числе я. На ноуте стоит NVIDIA 9600GTS, на удалённом серваке под Debian x64 крутится 4 tesla карточки. Соответственно начальный вариант на маленьких объёмах пишется и отлаживается локально, а потом уже сборка и тестинг на удалённой машине.
Нажмите, чтобы раскрыть...

то бишь для куды нет разницы между количеством карт и их поколениями? те дополнительных телодвижений при смене оси, смене/добавлении гпу нет? это еще интереснее.

хорошо, а дрова с поддержкой гпу есть и под вынь и под линь, но открытых для порта нет?

-------------
кстати, чтото я слышал о использовании шэйдеров для расчетов на видюхах. их поддержка более встречается. что скажете насчет этого момента?

Booster · 6 окт 2010

qqwe
Что ты хочешь? ГПУ в не конкуренции по соотношению цена/производительность. Если заказчик хочет сэкономить, то он будет экономить. Что ещё?

Booster · 6 окт 2010

>кстати, чтото я слышал о использовании шэйдеров для расчетов на видюхах. их поддержка более встречается. что скажете насчет этого момента?
Шейдеры предназначены для рендера, для расчётов они слишком ограничены. Но тут нужно смотреть конкретную задачу. Например шедейры на старых картах не умеют работать с целыми числами, а это существенный минус. А те что умеют, умеют и производить расчёты, но без лишнего гемороя.

qqwe · 6 окт 2010

W4FhLF

Потому что собирать кластер на CPU может себе позволить не каждый и не каждый заказчик согласится на это.
Нажмите, чтобы раскрыть...

сетевой грид делается просто. хотя, тут очень сильно зависит от требований. но поддержать несколько 100тен тысяч компов в гриде никакая не проблема.
вся настройка будет заключаться в указании регистратора и выдаче задания.

(снова говорю - тут все очень сильно зависит от задачи. если задача совсем не параллелится, то не судьба)

Решение на CPU обойдётся в любом случае дороже. Тут уже и обычный корпус не подойдёт и весьма экзотические комплектующие нужны (корпус, мамка, охлаждение).
Нажмите, чтобы раскрыть...

не пойму я зачем вам чтото экзотическое. все обычное и половина лишнего. и можно вообще ничего не покупать.

Booster

осталось только дождаться когда все это выйдет из зеленой юности, а гпу перестанет цепляться за видеокарты, а перейдет как и фпу в свое время в разряд обязательных сопроцессоров.
Нажмите, чтобы раскрыть...

Гонево же, причём очевидное.
Нажмите, чтобы раскрыть...

к чему относится ваша реплика и какой в ней смысл?

Booster · 6 окт 2010

qqwe

к чему относится ваша реплика и какой в ней смысл?
Нажмите, чтобы раскрыть...

Это ваша реплика. А означает она то, что ничего ждать не надо. Understand?

W4FhLF · 6 окт 2010

qqwe

то бишь для куды нет разницы между количеством карт и их поколениями? те дополнительных телодвижений при смене оси, смене/добавлении гпу нет? это еще интереснее.
Нажмите, чтобы раскрыть...

Когда существует более одного устройства GPU (т.е. multiGPU), то утилизация всех ресурсов это уже задача разработчика. Можете распределять вычисления согласно производительности каждого из устройств или избрать другую стратегию. Один из мои знакомых, работающий в NVIDIA, как раз разрабатывает API для гибридных (multi-GPU + multi-CPU) асинхронных (поскольку I/O операции на GPU и вычисления могут выполнятся абсолютно параллельно) систем.

Что касается совместимости, то, скажем, CUDA 3.2 поддерживает карты поколения начиная от 9x-GT200-GF100, т.е. всё, что выходило последние 3 года. Поэтому просто ставите новый драйвер и работаете.

Кстати на GPU уже DDR5 вовсю юзают.

хорошо, а дрова с поддержкой гпу есть и под вынь и под линь, но открытых для порта нет?
Нажмите, чтобы раскрыть...

Дрова есть для Win/Linux/MacOS причём как 32, так и 64 версии. Открытых нет, да это и ненужно. Я работал с CUDA на системах XP-Vista-Win7-Debian-Fedora. Везде всё как часы пашет. В отличии от OpenCL скажем

кстати, чтото я слышал о использовании шэйдеров для расчетов на видюхах. их поддержка более встречается. что скажете насчет этого момента?
Нажмите, чтобы раскрыть...

Ну это использовали лет 5-6 назад. Собственно это был предшествующий CUDA/OpenCL этап. Причём там серьёзные ограничения были. Короче это удаление гланд через ж**у.

spa · 6 окт 2010

qqwe
с логикой явные проблемы, явные.

Booster · 6 окт 2010

W4FhLF

Дрова есть для Win/Linux/MacOS причём как 32, так и 64 версии. Открытых нет, да это и ненужно. Я работал с CUDA на системах XP-Vista-Win7-Debian-Fedora. Везде всё как часы пашет. В отличии от OpenCL скажем
Нажмите, чтобы раскрыть...

Никто не заставляет отказываться от куды. Можно использовать куду + brook, в зависимости от вендора. Но OpenCL всё же предпочтительнее для портируемости.

qqwe · 6 окт 2010

Booster

Что ты хочешь? ГПУ в не конкуренции по соотношению цена/производительность. Если заказчик хочет сэкономить, то он будет экономить. Что ещё?
Нажмите, чтобы раскрыть...

я написал - все зависит от цели этого проекта. если проект пишется для широкой аудитории, то решение на гпу не может быть единственным, тк у среднего пользователя с высокой вероятностью гпу нет и необходимость выложить свои деньги на покупку еще одной _видеокарты_ он не поймет и воспримет в штыки. в точности как в опыте выше. или он будет считать периодическое подвисание картинки оч серьезным недостатком.

а вы мне принялись доказывать, что гпу считать умеет. я знаю это.

насчет цена/производительность я не знаю. конкуренты по производительность есть, а по ценам я выборки не делал.

Шейдеры предназначены для рендера, для расчётов они слишком ограничены. Но тут нужно смотреть конкретную задачу. Например шедейры на старых картах не умеют работать с целыми числами, а это существенный минус. А те что умеют, умеют и производить расчёты, но без лишнего гемороя.
Нажмите, чтобы раскрыть...

пример, как использовать шейдеры для обычных расчетов проссылить можете? меня как раз плавучка и интересует.

Booster · 6 окт 2010

qqwe

я написал - все зависит от цели этого проекта. если проект пишется для широкой аудитории, то решение на гпу не может быть единственным, тк у среднего пользователя с высокой вероятностью гпу нет и необходимость выложить свои деньги на покупку еще одной _видеокарты_ он не поймет и воспримет в штыки. в точности как в опыте выше. или он будет считать периодическое подвисание картинки оч серьезным недостатком.
Нажмите, чтобы раскрыть...

Cейчас цена на видеокарту поддерживающую General-Purpose computation, бюджетна. И пользователь без оной это пользователь в криокамере.

пример, как использовать шейдеры для обычных расчетов проссылить можете? меня как раз плавучка и интересует.
Нажмите, чтобы раскрыть...

Посмотрите здесь - http://gpgpu.org/. Хотя насчёт именно использования шейдеров не скажу.
Но принцип там до безобразия тупой и надо сказать тормозной. Передаём текстуру или группу текстур в пиксельный шейдер, в пиксельном шейдере считываем данные с этих текстур, делаем обработку в шейдере, рендерим в другую текстуру, и в конце считываем эту текстуру в оперативную память.

qqwe · 6 окт 2010

W4FhLF

Когда существует более одного устройства GPU (т.е. multiGPU), то утилизация всех ресурсов это уже задача разработчика. Можете распределять вычисления согласно производительности каждого из устройств или избрать другую стратегию. Один из мои знакомых, работающий в NVIDIA, как раз разрабатывает API для гибридных (multi-GPU + multi-CPU) асинхронных (поскольку I/O операции на GPU и вычисления могут выполнятся абсолютно параллельно) систем.
Нажмите, чтобы раскрыть...

те, это возлагается на прогу - заметить наличие дополнительных гпу, учесть их возможности и ограничения и выдать им задания? немного сложно. например, для гпу стоящего как видеокарта, видимо, надо учитывать вочдог.
хотя, в принципе, те же телодвижения, что и для грида.

Кстати на GPU уже DDR5 вовсю юзают.
Нажмите, чтобы раскрыть...

на видюхи всегда память побыстрее ставили. хотя, это зависит от карты. на нотах память разделяемая и будет тормозить даже больше, чем предполагается из типа.

Открытых нет, да это и ненужно.
Нажмите, чтобы раскрыть...

почему не нужно?

Ну это использовали лет 5-6 назад. Собственно это был предшествующий CUDA/OpenCL этап. Причём там серьёзные ограничения были. Короче это удаление гланд через ж**у.
Нажмите, чтобы раскрыть...

это верно, но массовый потребитель идет не на гребне прогресса. и шэйдерные расчеты счас сможет подхватить большинство без необходимости обоснования дополнительных капиталовложений. в отличие от гпу. в чем их и ценность.

spa

с логикой явные проблемы, явные.
Нажмите, чтобы раскрыть...

кокие именно?

W4FhLF · 6 окт 2010

Не, ну если пользователю сообщить, что видюха за 300 баксов позволит перекодировать ему фильм за 3 часа вместо 20 обычных, то просто при следующем апгрейде он вместо нового проца купит видюху. Каждый конечно исходит из своих задач. А поскольку все алгоритмы которые сегодня реализуются для GPU изначально были реализованы на CPU, то ессно поддержка обычных процессоров никуда не девается.

asmlamo · 6 окт 2010

нуну. всем нам надо очень много, но не слышал я чтоб ктото просто так разбрасывался деньгами. особенно на дело.
Нажмите, чтобы раскрыть...

Вот что бы не раззбрасываться деньгами нужно покупать GPU ибо это дешевле в 10 раз.

GPU именно и покупают для экономии.

480 - стоит 500$

i7 300-500$

Но для того той же производительности как у 480 нужно купить 5-6 i7 а это выйдет 3000$

Booster · 6 окт 2010

Я свою HD 3850, год назад, брал за 3 тыс деревянных, и она мне позволяет смотреть HD фильмы с последними кодеками вполне комфортно. Так что это вполне доступно.

W4FhLF · 6 окт 2010

те, это возлагается на прогу - заметить наличие дополнительных гпу, учесть их возможности и ограничения и выдать им задания? немного сложно. например, для гпу стоящего как видеокарта, видимо, надо учитывать вочдог.хотя, в принципе, те же телодвижения, что и для грида.
Нажмите, чтобы раскрыть...

Да, поддержка multiGPU это программная часть. Я бы не стал здесь говорить о гриде, по-скольку это более высокий уровень абстракции. Например, вы в курсе, что сегодня самый мощный суперкомпьютер (китайчеги собрали полгода назад) на GPU? Это тоже грид, где вычислительный узел -- это GPU.

это верно, но массовый потребитель идет не на гребне прогресса. и шэйдерные расчеты счас сможет подхватить большинство без необходимости обоснования дополнительных капиталовложений.
Нажмите, чтобы раскрыть...

На шейдерах просто невозможно реализовать задачи массового "потребления", если речь не про графику.

asmlamo · 6 окт 2010

если проект пишется для широкой аудитории
Нажмите, чтобы раскрыть...

С чего вы это решили ?

насчет цена/производительность я не знаю
Нажмите, чтобы раскрыть...

Я вам давал ссылки ...

необходимости обоснования дополнительных капиталовложений. в отличие от гпу.
Нажмите, чтобы раскрыть...

А что там собственно говоря обосновывать ?

Ускорение расчетов в 10-20 раз за разумные деньги.

А там уж пользователь пусть сам решает. Мож там скряга на хламе i386 сидит.

Войти или зарегистрироваться

3000$. Собрать максимально-производительную машину

W4FhLF New Member

asmlamo Well-Known Member

W4FhLF New Member

Booster New Member

qqwe New Member

Booster New Member

Booster New Member

qqwe New Member

Booster New Member

W4FhLF New Member

spa Active Member

Booster New Member

qqwe New Member

Booster New Member

qqwe New Member

W4FhLF New Member

asmlamo Well-Known Member

Booster New Member

W4FhLF New Member

asmlamo Well-Known Member

Войти или зарегистрироваться

3000$. Собрать максимально-производительную машину

W4FhLF New Member

asmlamo Well-Known Member

W4FhLF New Member

Booster New Member

qqwe New Member

Booster New Member

Booster New Member

qqwe New Member

Booster New Member

W4FhLF New Member

spa Active Member

Booster New Member

qqwe New Member

Booster New Member

qqwe New Member

W4FhLF New Member

asmlamo Well-Known Member

Booster New Member

W4FhLF New Member

asmlamo Well-Known Member

Быстрый поиск