Нажмите "Enter", чтобы перейти к содержанию

Таблица производительности видеокарт 2018: Сравнительная таблица производительности видеокарт

Содержание

Майнинг на видеокарте (GPU) в 2018 году: расчет окупаемости

Содержание

Если вы можете похвастаться компьютером с хорошей видеокартой, то можно начать добывать биткоины прямо сейчас. Однако для того, чтобы увеличить прибыль и заниматься этим профессионально, мы рекомендуем приобрести несколько видеокарт (оптимально от 4 до 6) и собрать собственную ферму для добычи криптовалюты.

За счёт установки нескольких видеоадаптеров вы сможете повысить уровень производительности компьютера, который будет считать намного быстрее т.к. именно видеокарты дают всю вычислительную мощность для майнинга (для большинства алгоритмов).

Отметим, что с учетом текущих цен на видеокарты в 2018 году стал выгоднее облачный GPU майнинг, который выгоднее покупки собственного оборудования, намного более гибкий в размере инвестиций и не требует обслуживания своих ферм. Мы сделали подробный обзор про облачную добычу криптовалюты с рейтингом лучших сервисов по итогам нескольких последних лет.

Сколько можно заработать на одной видеокарте?

Имея некоторое представление о том, как заработать на видеокарте, следует знать, какие видеоадаптеры подходят лучше всего для майнинга. Отличным вариантом станет AMD Radeon пятой серии и выше. Так как от производительности данного девайса будет зависеть итоговая сумма вашего заработка, рекомендуется обзавестись флагманами.

Есть мнение, что при использовании видеокарт производства AMD скорость вычисления немного выше, чем у аналогов под брендом nVidia. Но это сильно зависит от алгоритма вычислений на котором строится каждая конкретная криптовалюта. Соответственно, чем больше вычислений в секунду, тем существеннее ваш заработок.

Важно помнить, что если вы решите майнить, используя одну, даже самую топовую видеокарту, её производительности будет недостаточно. Вы потратите очень много времени, прежде чем добудете 1 BTC. Например, если будет задействован GPU Radeon HD 7970, ваш результат будет около 555 MH/s, а дневная добыча — на уровне 0,0031 BTC, или 80 центов. При этом стоит учитывать, что во время майнинга потребление электроэнергии возрастает. Поэтому такой способ добычи криптовалюты считается нецелесообразным.

Какую видеокарту выбрать — производительность на разных алгоритмах

Зная, как заработать на видеокарте, будущий майнер оказывается перед непростым выбором между тем или иным видеоадаптером, который необходимо приобрести для самодельной фермы.

Подробнее про выбор оптимальной модели GPU адаптера мы писали здесь, обязательно ознакомьтесь с материалом прежде чем принимать решение о покупке. Здесь мы подобрали наилучшие варианты, учитывая соотношение стоимости и прибыли. Для удобства восприятия информацию представим в виде таблицы.

Таблица производительности видеокарт в майнинге на разных алгоритмах:

Модель

видеокарты

Хешрейт

ZEC

Хешрейт ETC/ETC Потребляемая

энергия

Эффективность

ZCash (Sol/w)

Эффективность

Ethash (MHS/W)

GTX 1080 Ti 620 Sol 35 MH/s 250 Вт 2.48 0.140
GTX 1080 475 Sol 28 MH/s 180 Вт 2.63 0.153
RX 580 280 Sol 26 MH/s 185 Вт 1.51 0.140
RX 570 260 Sol 25 MH/s 150 Вт 1.73 0.166
GTX 1070 435 Sol 27 MH/s 150Вт 2.90 0.190
GTX 1060 282 Sol 20 MH/s 120 Вт 2.35 0/150
RX 480 300 Sol 29 MH/s 150 Вт 2.00 0.190
RX 470 250 Sol 24 MH/s 120 Вт 2.08 0.200
RX 460 110 Sol 11 MH/s 75 Вт 1.47 0.146
RX 560 120 Sol 12 MH/s 90 Вт 1.33 0.133
RX 550 70 Sol 10 MH/s 65 Вт 1.08 0.153
R7 370 150 Sol 190 Вт 0.78 ?
R7 360 155 Sol 100 Вт 1.00 ?
GTX 1050 Ti 155 Sol 13 MH/s 75 Вт 2.06 0.173
GTX 1050 135 Sol 60 Вт 2.25 ?

Приведённые в таблице модели окупаются намного быстрее своих аналогов и являются, судя по отзывам специалистов, наилучшим выбором для майнинга в 2018 году. Например, GTX 1070/1060 и RX 480/470 окупятся за 5-6 месяцев. Также не стоит забывать, что добывать криптовалюту с каждым днем становится всё сложнее, однако её стоимость постоянно растёт, что позволяет удерживать необходимый баланс, привлекая к майнингу новых людей.

Наиболее популярными для майнинга криптовалюты являются решения от лагеря красных — AMD. Связано это с конструктивными особенностями видеокарт, поэтому пользователи в первую очередь скупают такие решения, как Radeon RX 470 и выше. Тем не менее сегодня отставание по мощности для майнинга видеоадаптеров от Nvidia не колоссальное, поэтому такие популярные модели, как GTX 1060 и выше разлетаются как горячие пирожки.

Кстати, теория заговора о повышения интереса к криптовалюте со стороны производителей видеокарт имеет место быть, поскольку компания Nvidia готовит специализированные видеокарты для майнинга под названиями P104-100 и P106-100. Отличаются эти решения от классических видеоадаптеров тем, что ни не имеют видеовыходов, оснащены слабым охлаждением и обладают ограниченной гарантией. Именно поэтому обычному пользователю все же рентабельнее приобрести топовое решение в лице той же GTX 1070, ведь ее всегда можно будет продать геймеру, тем самым частично отбив ее первоначальную стоимость.

Расчет окупаемости видеокарт

GPU: Окупаемость: Без учета э/энергии:
Radeon RX 470 183 дня. (16% в мес) 145 дней. (20.6% в мес)
Radeon RX 480 193 дня (15.5% в мес) 156 дней (19.2% в мес)
Geforce GTX 1060 154 дня (19.4% в мес) 130 дней (23% в мес)
Geforce GTX 1070 185 дней (16.2% в мес) 162 дня (18.5% в мес)
Radeon Fury X 278 дней (10.7% в мес) 213 дней (14% в мес)

Как вы могли заметить из таблицы выше, самыми выгодными для майнинга на данный момент являются видеокарты Nvidia Geforce GTX 1060 3gb и Radeon RX 470 4gb. Стоит отметить, что это справедливо только на данный момент и на самом выгодном сейчас алгоритме Equihash, что будет дальше, какие алгоритмы появятся в будущем и как на них поведут себя данные видеокарты не известно.

Если вас интересует доходность майнинга именно сейчас, то вы можете выбирать Geforce GTX 1060 если вы поклонник Nvidia или Radeon RX 470 — если предпочитаете GPU от AMD. Для расчета прибыльности майнинга используются калькуляторы майнинга криптовалют для GPU (данные в них могут сильно различаться даже в течении одного дня, поскольку курс может резко меняться).

Скачать таблицу расчета доходности и окупаемости видеокарт на 2017 год.

Разгон видеокарт для повышения хешрейта при майнинге

Повышение производительности GPU карт для майнинга это неотъемлемая часть настройки фермы. Разгон может производиться с помощью специальных программ работающих из операционной системы, для этого мы рекомендуем MSI Afterburner. Также разгон видеокарты может быть достигнут за счет перепрошивки биоса.

Подробно о всех вариантах разгона мы рассказываем здесь, там же присутствуют и видео инструкции для карт AMD и Nvidia (принцип их разгона немного различается).

Также на нашем сайте представлены подробные обзоры самых популярных GPU для добычи криптовалюты в 2018 году:

  • Обзор видеокарты Geforce GTX 1050
  • Обзор видеокарты Geforce GTX 1060
  • Обзор видеокарты Geforce GTX 1070
  • Обзор видеокарты Geforce GTX 1080
  • Обзор видеокарты Radeon RX 480
  • Обзор видеокарты Radeon RX 580

Специальные видеокарты для майнинга от Nvidia

Компания Nvidia подготовила 2 графических адаптера, которые были специально разработаны для майнинга криптовалюты. Обе карты базируются на уже существующих чипах архитектуры Pascal, но были доработаны для более эффективного и производительного майнинга на Nvidia GTX чипах. Эти видеокарты с чипами GP104-100 и GP106-100 предоставлены авторизированными партнерами Nvidia.

Стоит отметить, что гарантия на эти видеокарты составляет всего 3 месяца. Запуск видеокарт для майнинга на Nvidia GTX ожидается в середине июня, но у разных поставщиков сроки могут меняться. Заявлено, что на графическом чипе P104-100 производительность/ватт увеличилась на 30% в сравнении с GTX 1060 3 Гб. А чип P106-100 в сравнении с той же видеокартой дает прирост 10%. Обе видеокарты выпускаются без видеоинтерфейсов.

Видеокарта Nvidia P104-100 использует тот же самый дизайн что и Nvidia GeForce GTX 1080. Но предоставляет гораздо больше производительности на 1 ватт потребленной электроэнергии, так как адаптер специально доработан для майнинга на Nvidia GTX. Карты от разных производителей поставляются с разными частотами чипов, в то время как эта базовая модель работает на базовой частоте 1607 МГц. Разгонная частота составляет 1733 МГц с пропускной способностью памяти 10 Гб/с GDDR5X при ширине шины в 256 бит.

Питание подается при помощи одного 8-контактного разъема, а энергопотребление примерно составляет 180 Вт. Базовая модель графического адаптера планируется к отгрузке по цене 350 долларов США, а вот модель от производителя Inno3D заявлена по цене в 370$ – Inno3D P6D-N104-1SDN P104-100 Twin X2 8GB GDDR5X. Эти цены значительно меньше, чем цены на их игровые аналоги (499$).

Заявленная производительность майнинга на Nvidia GTX P104-100 будет приблизительно около 60 МХ/с, но эта производительность будет достигнута только после обновления BIOS адаптера на новую прошивку.

Модель Nvidia P106-100 использует ту же конструкцию, что и Nvidia GeForce GTX 1060. Это дало возможность настроить графический адаптер под майнинг на Nvidia GTX значительно более эффективно. Адаптер работает на базовой частоте в 1506 МГц, турбо частота при этом составляет 1708 МГц, а пропускная способность памяти 8 Гб/с GDDR5 при шине 192 бита. Питание будет передаваться через 6-контактный разъем, а энергопотребление составит 120 Вт.

Цена базовой модели на рынке США составит 200$, что на 49$ дешевле игрового аналога GeForce GTX 1060 6 Гб. Вот цена конкретного адаптера Inno3D (N5G-N106-4SDN P106-100 Twin X2 6GB GDDR5) – 235$.

Источник: mining-cryptocurrency.ru

Nvidia RTX 2070 vs GTX 1070: сравнение игровой производительности

Сегодня вышли первые обзоры анонсированной пару месяцев назад видеокарты GeForce RTX 2070. Предлагаем ваши вниманию данные, полученные нашими коллегами из AnandTech и Tom’s Harware. Из них мы отобрали результаты по самой RTX 2070 и ряду других видеокарт, с которыми интересно сравнить нашего героя. Все данные приведения для референсных версий, на разрешении 4K, с максимальными настройками:

RTX 2080 Ti RTX 2080 GTX 1080 Ti RTX 2070 GTX 1080 GTX 1070
Начало продаж сентябрь 2018 сентябрь 2018 март 2017 сентябрь 2018 май 2016 июнь 2016
TDP 260 Вт 225 Вт 250 Вт 185 Вт 180 Вт 150 Вт
Цена в день релиза $1,200 $800 $700 $600 $700 $450
Производительность (FP32) 14.2 терафлопс 10.6 терафлопс 11.3 терафлопс 7.9 терафлопс 8.9 терафлопс 6.5 терафлопс
Ashes of the Singularity: Escalation 90.3 74.3 75.7 60.5 61.1 50.0
Battlefield 1 101.8 78.9 74.4 65.5 56.4 45.9
Destiny 2 77.0 62.0 52.7 48.5 45.8 37.0
Doom 113.0 93.7 63.0 77.7 62.1 54.2
Far Cry 5 73.0 57.0 54.0 47.0 42.0 34.0
Forza Motorsport 7 91.4 94.0 83.1 80.1 73.7 64.8
Grand Theft Auto V 64.9 47.7 51.6 42.5 39.5 34.3
Metro: Last Light Redux 61.2 47.4 45.8 39.6 33.3 27.7
Rise of the Tomb Raider 53.0 43.6 43.8 33.6 26.1 24.1
Tom Clancy’s The Division 31.9 26.0 25.6 23.9 20.5 16.2
World of Warcraft: Battle for Azeroth 42.6 42.2 42.7 47.5 40.7 35.2
Wolfenstein II: The New Colossus 126.7 102.4 75.2 77.1 59.8 49.6
Final Fantasy XV 61.1 47.6 45.2 38.3 34.6 27.3
Middle-earth: Shadow of War 73.8 59.2 50.7 49.3 39.9 32.4
F1 2018 101.4 79.6 77.3 66.3 59.1 47.9
Total War: Warhammer II 57.2 43.7 41.5 35.9 31.4 25.0

Результаты приведены в порядке убывания средней производительности, т.е. RTX 2070 занимает промежуточное положение между GTX 1080 Ti и GTX 1080 (хотя в операциях с плавающей точкой уступает им обеим). По сравнению с GTX 1070 быстродействие RTX 2070 выросло на 21-55%, а с GTX 1080 — на 6-29%.

Среди всех видеокарт из таблицы RTX 2070 отличается самым умеренным нагревом (74°C) и шумом (46.9 дБА). А вот энергопотребление (всего ПК) под нагрузкой (Battlefield 1), напротив, выросло — 356 Вт против 324 Вт у GTX 1080 и 304 Вт у GTX 1070.

AnandTech, Tom’s Harware

Лучшие видеокарты для майнинга 2017-2018, таблица и рейтинг

Выбираем лучшие видеокарты для майнинга в 2017-2018 году. В этой статье будет описано какие видеокарты лучше выбрать для майнинга, на каких картах хорошо майнить сразу две валюты, какие проще всего настроить.


Содержание:

До начала 2017 года самыми популярными картами  для майнинга были RX470, RX480. Так уж исторически сложилась архитектура карт от AMD, что они оказались намного выгоднее «зеленых». Цены варьировались в пределах 10 500 — 15 000, в зависимости от характеристик и производителя. А соотношение стоимости к производительности было просто превосходным. Но вот уже изо всех углов только и говорят о майнинге Ethereum, вспоминают былые времена, когда ещё  была выгодна добыча Bitcoin на домашнем оборудовании. С ростом популярности майнинга и огромным ажиотажем, местные ритейлеры взвинтили цены до не бывалых высот, но даже это не спасло от тотального дефицита по всей Росссии.

Тогда пытливый ум наших соотечественников и майнеров из других стран потихоньку начал приспосабливать карты от nVidia для ферм по добыче zCash, а позже и Ethereum’a.

 

Вечный вопрос NVIDIA vs ATI

Если вы занимаетесь майнингом криптовалют в качестве хобби, то однозначно стоит остановить свой выбор на RX-серии от AMD. Только с этими картами вы познаете все прелести майнинга: прошивка bios,  бессонные ночи около фермы, краши системы от переразгона и правильная организация питания.На самом деле не все так страшно, но с ATI, без опыта, придется повозится значительно дольше. Для профессионалов, при создания манинг-шахт, так же лучше подойдут карты от «красных», если такое производство строится за счет собственных средств.

Если же для заработка на майнинге вы хотите влезть в долговую яму, взяв кредит, тот тут остается только nVidia с их серией GTX. Вы и так возьмете на себя огромный риск, но хоть не будете думать об отвале ригов. Также карты от эн видиа подойдут на безрыбье, если других карт попросту нет.

P.S. Видеокарты Radeon проблематичны в настройке — драйвера встают не с первого раза, или работают некорректно. Но на них очень хорошо майнить одновременно две валюты (например ethereum + decreed). А это не может не радовать, ведь окупаемость уменьшается до 154 дней. Видеокарты от nVidia не требует прошивки bios в отличии от амд. Читайте также: Как разогнать видеокарты?

Какие видеокарты подходят для майнинга?

Вот, список видеокарт на которых можно майнить криптоволюты хоть с каким-то профитом:

Radeon от AMD:

  • Radeon RX 460
  • Radeon RX 470
  • Radeon RX 480
  • Radeon RX 570
  • Radeon RX 580

Geforce от nVidia:

  • Geforce GTX 1050 ti
  • Geforce GTX 1060
  • Geforce GTX 1060 ti
  • Geforce GTX 1070
  • Geforce GTX 1070 ti
  • Geforce GTX 1080
  • Geforce GTX 1080 ti

Какие видеокарты быстрее всего окупятся в майнинге?

Список лучших видеокарт по показателю стоимость/производительность:

GPU:  Хешрейт Ethash: Цена Computer Universe (промокод на скидку 5€:  FWTGWBP)
Radeon RX 470, 570 27,5 Mh/s, 28 Mh/s 16 700
Radeon RX 480, 580 29 Mh/s, 30,3 Mh/s 18 500
Geforce GTX 1060 24 Mh/s 15 300
Geforce GTX 1070 28 Mh/s 27 000

Может быть интересно: Как покупать на computeruniverse?

Окупаемость:

 

Каких производителей лучше всего выбрать?

С архитектурой определились, осталось выбрать производителя.

Среди Radeon хорошо себя зарекомендовали следующие производители: MSI, Sapphire, Asus.

  • MSI — только Gaming X серия, Armor брать не рекомендуем
  • Asus — только Strix серия, Dual использовать не советуем
  • Sapphire — достойные Nitro, Nitro+ без этих надписей покупать не стоит, также у сапфиров текут термопрокладки, нужно обслуживать

Среди GTX выделились следующие производители: MSI, Asus, nVidia.

  • MSI — аналогично RX, только Gaming X серия
  • Asus — для 1060, 1070 все серии, включая референсные (сделанные по дизайну самого производителя)
  • nVidia — на данный момент предлагают только турбинные видеокарты

Немного юмора: Palit — ваш дом спалит.

 

Лучшие видеокарты для игр 2019

Дискретная видеокарта является одним из основных компонентов современного компьютера. К выбору видеокарты нужно относиться очень серьезно, чтобы не получилась ситуация, когда процессор с легкостью раскрывает видеокарту и работает далеко не на максимум. В таком случае лучше выбрать более слабый процессор и сэкономленные деньги оставить на видеокарту получше.

В данном обзоре собраны лучшие видеокарты для игр 2019 года, которые ещё в предыдущем году стали очень популярными среди покупателей. Видеокарты текущего рейтинга распределены на графические адаптеры уровней энтузиаст, профессионал, средний и бюджетный. А также рекомендуем обратить внимание на таблицу производительности видеокарт 2019 года.

Топовые видеокарты для игр 2019

GeForce RTX 2080 Ti

  • Количество потоковых процессоров: 4352
  • Частота ядра: 1,545 МГц
  • Память: 11 Гб GDDR6
  • Частота памяти: 14,000 МГц
  • Разрядность шины памяти: 352 Бит

В течение долгого времени GTX 1080 Ti легко воспроизводила все игры 4K со скоростью стабильных 60 кадров в секунду. Последние же игровые проекты начали требовать увеличения производительности видеокарт топового сегмента. Компания NVidia представила нового лидера в лице GeForce RTX 2080 Ti, который в одиночку с легкостью выдает стабильные 60 FPS в 4К.

GeForce RTX 2080

  • Количество потоковых процессоров: 2944
  • Частота ядра: 1,710 МГц
  • Память: 8 Гб GDDR6
  • Частота памяти: 14,000 МГц
  • Разрядность шины памяти: 256 Бит

Несомненно RTX 2080 Ti является самой быстрой видеокартой на начало 2019 года и обладает всевозможными классными и потенциально полезными функциями, но исходя из цен пользователям стоит обратить внимание на GeForce RTX 2080. Как и в топовом решении пользователь получает те же функции трассировки лучей и глубокого обучения, но при этом есть возможность сэкономить несколько сотен долларов.

Radeon VII

  • Количество потоковых процессоров: 3840
  • Частота ядра: 1400 МГц
  • Память: 16 Гб HBM2
  • Частота памяти: 1000 МГц
  • Разрядность шины памяти: 4096 Бит

В начале 2019 года AMD настоятельно решили отбить в конкурентов не только рынок процессоров, но и видеокарт. Radeon VII является приемником  RX Vega, который выполнен по 7-нм технологическому процессу. На практике тестирование показало, что из-за в большинстве проектов оптимизации не достаточно для того, чтобы выйти на первые позиции нашего рейтинга. Но все же она является основным конкурентом для лидеров Nvidia на сегодня.

Radeon RX Vega 64

  • Количество потоковых процессоров: 4096
  • Частота ядра: 1406 МГц
  • Память: 8 Гб HBM2
  • Частота памяти: 945 МГц
  • Разрядность шины памяти: 2048 Бит

До выпуска первых видеокарт от AMD на новой архитектуре пользователи полагали большие надежды на новый продукт. Не смотря но новую память и потрясающие характеристики Radeon RX Vega 64 выпускалась чтобы конкурировать с прошлогодними решениями от NVidia.

RX Vega 64 — самый быстрый на сегодняшний день продукт от AMD, который легко справится с современными играми. В сравнении с GTX 1080 Ti производительность Vega 64 остается на уровне, а в проектах с поддержкой DirectX 12 превосходит конкурента.

GeForce GTX 1080 Ti

  • Количество потоковых процессоров: 3584
  • Частота ядра: 1,518 МГц
  • Память: 11 Гб GDDR5X
  • Частота памяти: 11,010 МГц
  • Разрядность шины памяти: 352 Бит

GeForce GTX 1080 Ti в начале 2019 года всё ещё отлично себя показывает в большинстве игровых проектов даже в 4К. Минусом текущей видеокарты на сегодняшний день является отсутствие поддержки эффектов трассировки лучей, которыми обладает обновленная линейка видеокарт серии RTX.

GeForce RTX 2070

  • Количество потоковых процессоров: 2304
  • Частота ядра: 1,620 МГц
  • Память: 8 Гб GDDR6
  • Частота памяти: 14,000 МГц
  • Разрядность шины памяти: 256 Бит

GeForce RTX 2070 является третьей видеокартой в линейке, цена которой значительно меньше видеокарт текущей серии. Видеокарта RTX 2070 на самом деле по производительности уступает предыдущему поколению GTX 1080 Ti, по крайней мере в проектах, которые не поддерживают трассировку лучей в реальном времени и возможности искусственного интеллекта.

GeForce RTX 2060

  • Количество потоковых процессоров: 1920
  • Частота ядра: 1,710 МГц
  • Память: 6 Гб GDDR6
  • Частота памяти: 14,000 МГц
  • Разрядность шины памяти: 192 Бит

Только представленная видеокарта в начале 2019 года уже появилась на прилавках магазинов и успешно продается. Если же говорить о мощности, то она немного не дотягивает к GTX 1080. Стоит сказать что решение ранее среднего класса также получило поддержку функции трассировки лучей. Теперь не нужно ради неё покупать топовые решения, достаточно взять RTX 2060.

Radeon RX Vega 56

  • Количество потоковых процессоров: 3584
  • Частота ядра: 1,156 МГц
  • Память: 8 Гб HBM2
  • Частота памяти: 800 МГц
  • Разрядность шины памяти: 2048 Бит

В свою очередь Radeon RX Vega 56 является прямым конкурентом не плохо себя показавшей GeForce GTX 1070, немного опережая её в DirectX 12. Производительности текущей видеокарты достаточно в 2019 году для любых игр. Благодаря новому типу памяти получилось увеличить разрядность шины памяти и количество потоковых процессоров.

Видеокарты среднего уровня для игр 2019

Radeon RX 590

  • Количество потоковых процессоров:
  • Частота ядра: 1,560 МГц
  • Память: 8 Гб GDDR5
  • Частота памяти: 8,000 МГц
  • Разрядность шины памяти: 256 Бит

Буквально недавно представленная видеокарта Radeon RX 590 является прямым конкурентом GTX 1060, с которым с легкостью справляется показывая прирост в 10-15% в зависимости от игры. В сравнении с RX 580 стоит отметь не так небольшое увеличение рабочих частот, как переход на меньший 12 нм технологический процесс. Radeon RX 590 достаточно пользователям, которые собираются играть в FHD.

GeForce GTX 1060

  • Количество потоковых процессоров: 1280
  • Частота ядра: 1,360 МГц
  • Память: 6 Гб GDDR5
  • Частота памяти: 8,208 МГц
  • Разрядность шины памяти: 192 Бит

Даже в начале 2019 года решение от зеленых в лице GeForce GTX 1060 является популярным выбором пользователей ожидающих стабильные 60 кадров в секунду на мониторах с FHD. Пользователям приходиться выбирать GTX 1060, поскольку компания NVidia немного затянула с выходом RTX 2060. Хотя версии на 6 Гб видео памяти достаточно большинству игр.

Radeon RX 580

  • Количество потоковых процессоров: 2304
  • Частота ядра: 1,257 МГц
  • Память: 8 Гб GDDR5
  • Частота памяти: 8,000 МГц
  • Разрядность шины памяти: 256 Бит

В некоторых играх RX 580 показывает себя не хуже GTX 1060, при этом цена которой значительно ниже. Тут главное при выборе такой видеокарты смотреть, чтобы были повышенные частоты и 8 Гб памяти. Если же сравнивать модель Sapphire Radeon RX 580 Nitro+ Special Edition, в которой частоты значительно выше, то она значительно превосходит GTX 1060 6 Гб в играх.

Бюджетные видеокарты для игр 2019

Radeon RX 570

  • Количество потоковых процессоров: 2048
  • Частота ядра: 1,244 МГц
  • Память: 4 Гб GDDR5
  • Частота памяти: 7,000 МГц
  • Разрядность шины памяти: 256 Бит

Серия RX пришла на смену R9 серии видеокарт предлагая по сути не большой прирост производительности и уменьшенный технологических процесс на новой архитектуре. Radeon RX 570 позволяет комфортно играть любые игры не высоких настройках. А также присутствует поддержка DirectX 12, в котором RX 570 наступает на пятки GTX 1060.

GeForce GTX 1050 Ti

  • Количество потоковых процессоров: 768
  • Частота ядра: 1,392 МГц
  • Память: 4 Гб GDDR5
  • Частота памяти: 7,008 МГц
  • Разрядность шины памяти: 128 Бит

Хоть и на первый взгляд может показаться, что характеристики действительно слабые, но благодаря новой архитектуре и значительно повышенным частотам GeForce GTX 1050 Ti не плохо себя показывает в новых проектах. В играх на мониторах с 1080p пользователь получает от 30 до 60 кадров в секунду. Похоже что GTX 1050 Ti прямой конкурент не RX 570, как может показаться на первый взгляд, а Radeon RX 560.

Таблица производительности видеокарт 2019

Выбрать видеокарту предлагаем Вам исходя из ценовой категории и производительности видеокарт в целом. В таблицу производительности попали лучшие видеокарты для игр начала 2019 года. Однозначно можно найти видеокарты ещё дешевле и отнести их к бюджетным, но они уже не будут выдавать комфортное значение количества кадров в секунду. Показатели количества кадров в секунду на разных разрешениях были усреднены и записаны в таблицу производительности видеокарт.

Уровень Видеокарта Разрешение и производительность
Энтузиаст GeForce RTX 2080 2160p & 60 FPS
GeForce RTX 2080
GeForce GTX 1080 Ti
Radeon Vega 64
Профессиональный GeForce RTX 2070 1440p & 60 FPS
2160p & 30 FPS
GeForce RTX 2060
GeForce GRX 1070 Ti
Radeon Vega 56
Средний Radeon RX 590 1080p & 60 FPS
1440p & 30 FPS
GeForce GTX 1060
Radeon RX 580
Бюджетный Radeon RX 570 1080p & 30-60 FPS
GeForce GTX 1050 Ti

Заключение

Пока все поклонники красных ждут ответа на обновленную серию зеленых от компании AMD, мы же собрали лучшие видеокарты для игр начала 2019 года. Здесь собраны все топовые видеокарты для игр начала 2019 года исходя из потребностей пользователей. А также присутствует сравнение в таблице производительности видеокарт 2019 для хотя бы примерной оценки возможностей графических адаптеров.

Лучшие Видеокарты для Майнинга 2018 Таблица

Автор:
Владислава Котова
9 декабря, 2017 Рубрики: Разное

Лучшая видеокарта для майнинга 2018 года, какая она? В этой статье мы расскажем о лучших GPU для майнинга Bitcoin, Ethereum и т.д.

Вероятнее всего, вы уже слышали о Bitcoin, Ethereum и других криптовалютах, которые многие считают цифровыми валютами будущего, поскольку они представляют собой действительно перспективный способ заработка денег.
Суть криптовалют вроде Bitcoin или Ethereum сводится к тому, что они генерируются, и их можно переводить между индивидуумами, не полагаясь на централизованные органы вроде традиционных банков.
Радует факт того, что для «добычи» криптовалюты вы можете использовать обычный персональный компьютер. Многие виды цифровых валют, включая и Ethereum, используют технологии хеширования, сложность которых обеспечивается ограниченной скоростью доступа к памяти. Именно поэтому для эффективного майнинга вам потребуется персональный компьютер с видеокартой высокого уровня с большим объемом видеопамяти.
Таким образом, выбирая лучшую видеокарту для майнинга, следует принимать во внимание объем памяти, а также ее стоимость и уровень потребления электроэнергии. Графический процессор для майнинга поначалу не будет приносить желаемое количество криптовалюты, если только у вас не найдется кругленькой суммы на покупку нескольких видеокарт.
Вероятнее всего вы захотите минимизировать свои первоначальные эксплуатационные расходы, при этом обеспечив получение максимальной прибыли. Именно поэтому мы и составили данный рейтинг лучших видеокарт, обладающих всеми необходимыми для майнинга криптовалюты требованиями.

1. Nvidia GeForce GTX 1070

Низкое потребление энергии, высокий уровень хэшрейта

  • Отличное соотношение потребления энергии и хэшрейта (показателя количества операций хэширования, который майнер способен выполнить за определенный промежуток времени)
  • Большой объем памяти
  • Высокая стоимость устройства

Видеокарта GTX 1070 от компании Nvidia – это не только отличное решение для геймеров, но еще и великолепный графический процессор для майнинга. Все потому, что видеокарта обеспечивает высокий уровень хэшрейта (около 30 мегахеш/сек) при небольшом количестве потребляемой электроэнергии. Важно помнить, что чем больше энергии требует графический процессор, тем дороже обходится его эксплуатация, что не может не сказываться на размерах окончательной прибыли. Как и многие другие новые видеокарты Nvidia, модель 1070 имеет достаточно высокую стоимость, поэтому вначале придется потратиться. Однако если вы серьезно и долгосрочной перспективе решили заняться майнингом криптовалют, GTX 1070 можно считать едва ли не самой лучшей видеокартой для майнинга, доступной сегодня.

Ключевые особенности
Тактовая частота графического ядра 1,506МГц
Объем видеопамяти 8Гб типа GDDR5
Быстродействие памяти 8 Гбит/с
Разъемы питания 1 x 6-pin
Потребление энергии 150 Ватт
Стандартные разъемы 3 x DisplayPort 1.4, 1 x HDMI 2.0, DL-DVI
Цена $480

2. AMD Radeon RX 580

Самая востребованная видеокарта для майнинга от компании AMD

  • Отличный ценник
  • Хорошая система охлаждения
  • Сложно найти в наличии из-за популярности у майнеров

AMD Radeon RX 580 можно по праву считать одной из самых лучших видеокарт, предназначенных для майнинга. Она даже стала, в некотором роде, жертвой собственной «крутости», поскольку ее невероятно сложно найти в наличии у продавцов. Однако популярность этой видеокарты небезосновательна: она обеспечивает отличный уровень хэшрейта – 29 мегахэш/сек, при этом сохраняя низкое энергопотребление. Кроме всего прочего, цена данной модели ниже, чем у видеокарты GTX 1070. Если вы не побоитесь немного порыться в настройках, то обязательно останетесь довольны майнинговой производительностью данной карты.

Ключевые особенности
Тактовая частота графического ядра 1,257МГц
Объем видеопамяти 8Гб типа GDDR5
Быстродействие памяти 8 Гбит/с
Разъемы питания 1 x 8-pin, 1 x 6-pin
Потребление энергии 185 Ватт
Стандартные разъемы 1 DisplayPort 1.4, 1 x HDMI 2.0
Цена $260

3. AMD RX 480

Относительно старая видеокарта, но с отличными возможностями для майнинга

  • Низкая стоимость
  • Отличная производительность майнинга
  • Дефицитная модель

Если желаете заплатить низкую цену за приобщение к миру майнинга, видеокарта AMD RX 480 станет отличным вариантом. Низкая стоимость объясняется тем, что данная модель считается относительно устаревшей в сравнении с AMD Radeon RX 580 (если вам удастся ее найти). Да, AMD RX 480 – это еще одна дефицитная видеокарта, благодаря своим возможностям по добыче криптовалюты. Вместе с этим, 8Гб видеопамяти типа GDDR5 позволяет видеокарте достигать уровня хешрейта до 28 мегахэш/сек, опять-таки, не потребляя огромного количества электроэнергии. Кроме этого, если вы бы хотели приобрести еще более дешевую видеокарту для майнинга, доступны конфигурации данной модели с объемом видеопамяти 4Гб.

Ключевые особенности
Тактовая частота графического ядра 1,120МГц
Объем видеопамяти 8Гб типа GDDR5
Быстродействие памяти 8 Гбит/с
Разъемы питания 1 x 8-pin, 1 x 6-pin
Потребление энергии 150 Ватт
Стандартные разъемы 1 DisplayPort 1.4, 1 x HDMI 2.0
Цена $370

4. AMD Radeon RX Vega 56

Видеокарта с графической производительностью выше пределов своих возможностей

  • Отличная производительность для майнинга
  • Высокий уровень энергопотребления
  • Немного греется при работе

AMD Radeon RX Vega 56 является одной из самых хорошоукомплектованных графических карт, доступных на рынке на сегодняшний день. Тесты производительности подтверждают, что данная модель работает быстрее, чем видеокарта Nvidia GTX 1070. Благодаря повальной увлеченности майнингом биткоинов, графический процессор AMD Radeon RX Vega 56 станет выгодным вложением. Опять-таки, вполне вероятно, что данную модель не так просто найти, а уровень ее энергопотребления говорит о том, что видеокарта окажется дорогостоящим удовольствием в условиях ее круглосуточного использования в целях майнинга. Впрочем, майнинговые возможности AMD Radeon RX Vega 56 сложно переоценить, поэтому, если вам удастся ее найти, определенно, стоит подумать о ее приобретении.

Ключевые особенности
Тактовая частота графического ядра 1,156МГц
Объем видеопамяти 8Гб типа HBM2
Быстродействие памяти 800МГц
Разъемы питания 2 x 8-pin
Потребление энергии 210 Ватт
Стандартные разъемы 3 x DisplayPort 1.4, 1 x HDMI 2.0
Цена $500

5. Nvidia GTX 1080 Ti

Великолепная, но дорогая, видеокарта для майнинга

  • Невероятная мощность
  • БОтличный уровень хэшрейта
  • Высокая стоимость самой карты и ее эксплуатации

Nvidia GTX 1080 Ti остается одной из самых мощных видеокарт в мире. В частности, данная модель является лучшим вариантом для 4К игр. Впрочем, графический процессор Nvidia GTX 1080 Ti также станет отличным выбором в качестве видеокарты для добычи криптовалюты. Однако есть несколько нюансов, которые не позволили данной видеокарте оказаться выше в этом рейтинге. Во-первых, GTX 1080 Ti имеет достаточно высокий ценник. Также уровень потребления электроэнергии видеокарты выше других в нашем рейтинге. Это значит, что на то, чтобы «отбить» свои первоначальные вложения, вам понадобится больше времени. Если вы готовы потратиться на данную видеокарту (или вы также планируете использовать ее, чтобы играть в игры), результаты вас не разочаруют. При более углубленной настройке вы сможете добиться показателей хэшрейта на уровне 32 мегахэш/сек.

Ключевые особенности
Тактовая частота графического ядра 1,480МГц
Объем видеопамяти 11Гб типа GDDR5X
Быстродействие памяти 11 ГГц
Разъемы питания 1 x 6-pin; 1 x 8-pin
Потребление энергии 250 Ватт
Стандартные разъемы 3 x DisplayPort 1.4, 1 x HDMI 2.0
Цена $730

Об авторе Владислава Котова

Таблица производительности видеокарт в 2022 году

Список видеокарт по убыванию усредненных результатов в бенчмарках и играх.

Учитываются видеокарты всех производителей и для всех рынков (десктопные, ноутбучные и для рабочих станций).

Видеокарты, для которых нет ни одного результата в бенчмарках и играх, в рейтинге не участвуют

Видеокарта  Производи-
тельность
АрхитектураГод ЦенаTDP  
1NVIDIA GeForce RTX 3080 Ti100.00Ampere20202389 USD350 W
2NVIDIA GeForce RTX 309097.72Ampere20203370 USD350 W
3AMD Radeon RX 6900 XT95.06Navi / RDNA220201870 USD300 W
4NVIDIA GeForce RTX 308092.05Ampere20202178 USD320 W
5NVIDIA RTX A500088.45Ampere20214166 USD230 W
6AMD Radeon RX 6800 XT86.48Navi / RDNA220201644 USD300 W
7NVIDIA GeForce RTX 3070 Ti84.95Ampere20211421 USD290 W
8NVIDIA GeForce RTX 307082.27Ampere20201380 USD220 W
9NVIDIA GeForce RTX 2080 Ti81.45Turing20181489 USD250 W
10NVIDIA Quadro P5000 (мобильная)80.78Pascal20172137 USD100 W
ВидеокартаПроизводи-тельностьАрхитектураГодЦенаTDP
11NVIDIA Quadro RTX A600078.43Ampere202013156 USD300 W
12AMD Radeon RX 680077.89Navi / RDNA220201766 USD250 W
13NVIDIA GeForce RTX 3060 Ti74.24Ampere20201044 USD200 W
14NVIDIA GeForce RTX 3080 Mobile73.92Ampere2021115 W
15NVIDIA Quadro RTX 800073.62Turing20185121 USD260 W
16NVIDIA Quadro RTX 600073.28Turing20189478 USD260 W
17NVIDIA GeForce RTX 2080 Super73.08Turing20191343 USD250 W
18NVIDIA GeForce GTX 1080 SLI (мобильная)72.93Pascal2016352 USD
19NVIDIA RTX A400072.93Ampere20214609 USD140 W
20NVIDIA Quadro RTX 3000 (мобильная)72.26Turing20192393 USD80 W
ВидеокартаПроизводи-тельностьАрхитектураГодЦенаTDP
21AMD Radeon Pro W680072.01Navi / RDNA220212800 USD250 W
22NVIDIA TITAN Xp71.66Pascal2017430 USD250 W
23NVIDIA GeForce GTX 1070 SLI71.42Pascal2016520 USD300 W
24NVIDIA TITAN RTX70.73Turing20182706 USD280 W
25AMD Radeon RX 6700 XT70.40Navi / RDNA220211123 USD230 W
26NVIDIA GeForce RTX 208069.76Turing20181532 USD215 W
274x NVIDIA RTX A600069.23Ampere
28NVIDIA GeForce GTX 1070 SLI (мобильная)68.95Pascal2016274 USD
29NVIDIA GeForce RTX 2070 Super68.11Turing20191244 USD215 W
30NVIDIA GeForce GTX 1080 Ti67.80Pascal2017942 USD250 W
ВидеокартаПроизвод.АрхитектураГодЦенаTDP
31NVIDIA GeForce GTX 1080 Ti67.80Pascal2017942 USD250 W
32NVIDIA GeForce RTX 2080 Super Mobile64.55Turing20201671 USD150 W
33NVIDIA GeForce RTX 2070 Super Mobile64.34Turing20201443 USD115 W
34NVIDIA TITAN V64.23Volta2017989 USD250 W
35NVIDIA GeForce GTX 1080 (мобильная)64.05Pascal2016230 USD150 W
36NVIDIA TITAN V CEO Edition63.71Volta20181630 USD250 W
37AMD Radeon Pro VII63.21GCN 5.120204876 USD250 W
38AMD Radeon RX 5700 XT63.19Navi / RDNA2019942 USD225 W
39AMD Radeon VII62.83Vega20191271 USD295 W
40AMD Radeon RX 5700 XT 50th Anniversary62.57RDNA 1.02019409 USD225 W
ВидеокартаПроизвод.АрхитектураГодЦенаTDP
41NVIDIA GeForce RTX 306062.37Ampere2021965 USD170 W
42NVIDIA GeForce RTX 2060 Super61.66Turing20191064 USD175 W
43NVIDIA Quadro RTX 500061.00Turing20184369 USD230 W
44NVIDIA GeForce RTX 207060.32Turing20181172 USD175 W
45NVIDIA Quadro P3000 (мобильная)60.13Pascal2017537 USD75 W
46NVIDIA GeForce GTX 980 SLI (мобильная)59.21Maxwell2015301 USD330 W
47AMD Radeon RX 6600 XT58.83Navi / RDNA22021748 USD160 W
48NVIDIA Quadro RTX 400058.47Turing20182039 USD160 W
49NVIDIA Quadro GP10058.31Pascal20162969 USD235 W
50NVIDIA Quadro P600058.04Pascal20162896 USD250 W
ВидеокартаПроизвод.АрхитектураГодЦенаTDP
51NVIDIA GeForce GTX 108056.93Pascal2016761 USD180 W
52NVIDIA GeForce GTX 108056.93Pascal2016761 USD180 W
53NVIDIA GeForce RTX 2080 (мобильная)56.66Turing20192003 USD150 W
54AMD Radeon Pro W570056.27RDNA 1.020191143 USD205 W
55NVIDIA Quadro RTX 5000 (мобильная)55.63Turing20193065 USD110 W
56NVIDIA RTX A3000 Mobile55.31Ampere2021115 W
57AMD Radeon Pro Vega II55.27GCN 5.120199999 USD475 W
58AMD Radeon RX 570055.08RDNA 1.020191190 USD180 W
59AMD Radeon RX 570055.08Navi / RDNA20191190 USD180 W
60AMD Radeon RX Vega 6455.00Vega20171330 USD295 W
61AMD Radeon Pro Vega 64X54.87GCN 5.02019366 USD250 W
62Apple M1 8-Core GPU54.772020
63NVIDIA RTX A5000 Mobile54.32Ampere2021140 W
64NVIDIA GeForce RTX 2070 Super Max-Q54.20Turing2020812 USD80 W
65NVIDIA RTX A200053.99Ampere20212663 USD70 W
66NVIDIA GeForce GTX 1070 Ti53.93Pascal2017491 USD180 W
67NVIDIA GeForce GTX 1070 Ti53.93Pascal2017491 USD180 W
68NVIDIA GeForce RTX 3070 Mobile53.87Ampere2021115 W
69NVIDIA Quadro RTX 5000 Max-Q52.76Turing20192130 USD80 W
70NVIDIA GeForce RTX 2080 Super Max-Q52.41Turing2020812 USD80 W
71NVIDIA GeForce RTX 2080 Max-Q52.11Turing20191268 USD80 W
72NVIDIA GeForce RTX 206052.06Turing2019766 USD160 W
73NVIDIA GeForce GTX 980 Ti52.04Maxwell20151195 USD250 W
74NVIDIA Quadro P2000 (мобильная)52.01Pascal20171477 USD50 W
75AMD Radeon Vega Frontier Edition51.99GCN 5.020173594 USD300 W
76AMD Radeon Pro W660051.99RDNA 2.02021812 USD100 W
77NVIDIA GeForce RTX 3060 Mobile51.97Ampere2021125 W
78AMD Radeon RX 5600 XT51.72RDNA 1.02020716 USD150 W
79AMD Radeon Pro WX 820051.69GCN 5.020182355 USD230 W
80AMD Radeon RX Vega 5651.01Vega20171587 USD210 W
81NVIDIA GeForce GTX 107050.33Pascal2016471 USD150 W
82NVIDIA GeForce GTX 107050.33Pascal2016471 USD150 W
83NVIDIA Quadro RTX 4000 Max-Q50.08Turing201980 W
84AMD Radeon RX 660049.68Navi / RDNA22021723 USD132 W
85NVIDIA GeForce GTX TITAN X49.07Maxwell 2.02015844 USD250 W
86NVIDIA Titan X Pascal48.86Pascal20161000 USD250 W
87NVIDIA Quadro RTX 4000 (мобильная)48.42Turing20192890 USD110 W
88NVIDIA Quadro GV10047.71Volta201815089 USD250 W
89AMD Radeon PRO WX 910047.64GCN 5.020172193 USD230 W
90NVIDIA GeForce GTX 1660 SUPER47.60Turing2019681 USD125 W
91NVIDIA GeForce GTX 1660 Super47.60Turing2019681 USD125 W
92NVIDIA Quadro M6000 24 GB47.45Maxwell 2.020161533 USD250 W
93NVIDIA Tesla M40 24 GB47.05Maxwell 2.02015456 USD250 W
94AMD Radeon Pro Vega 6446.51GCN 5.020176074 USD250 W
95NVIDIA GeForce RTX 2070 (мобильная)46.33Turing20191758 USD115 W
96AMD Radeon Pro Vega 5645.79Vega20174999 USD210 W
97NVIDIA GeForce RTX 2070 Max-Q45.58Turing20191311 USD80 W
98NVIDIA Quadro P520045.39Pascal20173894 USD100 W
99AMD Radeon Pro 5700 XT45.29RDNA 1.02020130 W
100NVIDIA GeForce RTX 3050 Ti Mobile45.09Ampere202175 W
ВидеокартаПроизвод.АрхитектураГодЦенаTDP
101NVIDIA Quadro P5200 Max-Q44.67Pascal2018100 W
102NVIDIA Quadro P500044.52Pascal20161721 USD180 W
103AMD Radeon Pro 570044.42RDNA 1.020201200 USD130 W
104AMD Radeon RX 6700M44.31RDNA 22020180 W
105NVIDIA GeForce GTX 1660 Ti44.17Turing2019950 USD120 W
106NVIDIA GeForce GTX 166043.66Turing2019682 USD120 W
107NVIDIA GeForce GTX 980 (мобильная)43.61Maxwell2014251 USD100 W
108NVIDIA Quadro P400043.38Pascal20171210 USD105 W
109NVIDIA Quadro T1000 (мобильная)42.99Turing20191890 USD50 W
110AMD Radeon Pro Vega 4842.69GCN 5.02019671 USD
111NVIDIA GeForce RTX 2060 (мобильная)42.58Turing20191250 USD115 W
112NVIDIA Quadro M600042.27Maxwell 2.020151603 USD250 W
113NVIDIA GeForce GTX 98042.22Maxwell2014528 USD220 W
114NVIDIA Tesla T441.60Turing20182569 USD70 W
115AMD Radeon Pro SSG39.37GCN 5.020171499 USD350 W
116AMD Radeon Pro 5600M39.32Navi / RDNA202050 W
117NVIDIA GeForce GTX 1070 (мобильная)39.25Pascal2016379 USD120 W
118NVIDIA GeForce GTX 970M SLI38.94Maxwell20141326 USD162 W
119NVIDIA GeForce GTX 980M SLI38.84Maxwell2014499 USD200 W
120NVIDIA GeForce GTX 1060 6 GB38.45Pascal2016538 USD120 W
121NVIDIA RTX A2000 Laptop GPU38.36Ampere2021
122NVIDIA GeForce GTX 1080 Max-Q38.28Pascal20171008 USD150 W
123NVIDIA GeForce GTX 1660 Ti (мобильная)38.17Turing2019682 USD
124AMD Radeon R9 FURY X38.00GCN 3.02015670 USD275 W
125NVIDIA Quadro RTX 3000 Mobile37.94Turing201980 W
126NVIDIA GeForce GTX 1650 SUPER37.39Turing2019701 USD100 W
127NVIDIA Quadro P420037.28Pascal20181526 USD100 W
128NVIDIA Quadro P4000 (мобильная)36.83Pascal20171053 USD100 W
129NVIDIA GeForce RTX 2060 Max-Q36.67Turing20191680 USD65 W
130NVIDIA GeForce GTX 1060 Max-Q 6 GB36.59Pascal20171010 USD80 W
131NVIDIA GeForce GTX 97036.47Maxwell2014277 USD150 W
132AMD Radeon R9 Fury36.35GCN 1.22015256 USD275 W
133NVIDIA Tesla M4036.19Maxwell 2.02015199 USD250 W
134AMD Radeon RX 59036.06Polaris2018261 USD175 W
135NVIDIA GeForce GTX 1060 3 GB35.96Pascal2016372 USD120 W
136NVIDIA Quadro P220035.95Pascal20192342 USD75 W
137AMD Radeon R9 390X35.71GCN2015750 USD275 W
138NVIDIA Quadro M500035.62Maxwell 2.02015986 USD150 W
139AMD Radeon Pro W550034.72RDNA 1.02020621 USD125 W
140NVIDIA Quadro P3200 Max-Q34.66Pascal201875 W
141NVIDIA GeForce GTX 780 Ti34.56Kepler2013400 USD250 W
142AMD Radeon RX 580 (мобильная)34.46Polaris2017410 USD100 W
143AMD Radeon RX 5500 XT34.34RDNA 1.02019696 USD130 W
144NVIDIA GeForce RTX 3050 Mobile34.21Ampere202175 W
145NVIDIA GeForce GTX TITAN BLACK34.20Kepler2014525 USD250 W
146NVIDIA GeForce GTX TITAN Z34.11Kepler20141215 USD375 W
147AMD Radeon RX 6600M33.88RDNA 22020150 W
148AMD Radeon R9 39033.63GCN 2.02015266 USD300 W
149AMD Radeon RX 58033.28Polaris2017551 USD185 W
150NVIDIA Quadro P4000 Max-Q33.06Pascal2017803 USD100 W
ВидеокартаПроизвод.АрхитектураГодЦенаTDP
151NVIDIA GeForce GTX 1660 Ti Max-Q33.06Turing20191037 USD
152AMD Radeon RX 550032.56RDNA 1.02019772 USD110 W
153AMD Radeon RX 48032.42Polaris201614 USD150 W
154NVIDIA Quadro RTX 3000 Max-Q32.35Turing201960 W
155AMD Radeon HD 8970M Crossfire32.01GCN2012170 USD200 W
156AMD Radeon RX 6800M31.98RDNA 22021145 W
157NVIDIA GeForce GTX TITAN31.98Kepler2013864 USD250 W
158NVIDIA Quadro P320031.90Pascal20172122 USD75 W
159AMD Radeon R9 Nano31.83GCN 1.22015379 USD175 W
160AMD Radeon R9 295X231.54GCN 2.02014600 USD500 W
161AMD Radeon Pro Duo31.48GCN 3.020165000 USD350 W
162NVIDIA GeForce GTX 880M SLI31.40Kepler20143098 USD206 W
163AMD Radeon Pro 5500 XT31.09RDNA 1.020202499 USD125 W
164NVIDIA GeForce GTX 1060 (мобильная)30.60Pascal2016240 USD80 W
165NVIDIA Quadro K600030.48Kepler2013672 USD225 W
166AMD Radeon R9 29030.35GCN 2.02013213 USD275 W
167NVIDIA GeForce GTX 1060 5 GB30.26Pascal2017203 USD120 W
168NVIDIA GeForce GTX 78030.24Kepler2013189 USD250 W
169AMD Radeon RX 47030.02GCN 4.02016184 USD120 W
170AMD Radeon RX 47030.02Polaris2016184 USD120 W
171NVIDIA Quadro T2000 Mobile29.95Turing201960 W
172NVIDIA Quadro M550029.69Maxwell20161700 USD150 W
173AMD Radeon Pro WX 710029.28Polaris2017582 USD130 W
174AMD Radeon RX 580X29.25GCN 4.02018191 USD185 W
175NVIDIA GeForce GTX 1650 Ti Mobile29.24Turing2020892 USD50 W
176NVIDIA GeForce GTX 965M SLI29.17Maxwell2015149 USD
177AMD Radeon Pro 58029.08GCN 4.020175999 USD150 W
178NVIDIA GeForce GTX 165029.07Turing2019541 USD75 W
179AMD FirePro W910029.07GCN 2.020141694 USD275 W
180AMD Radeon RX 580 2048SP28.95GCN 4.020181373 USD150 W
181NVIDIA Quadro T1200 Mobile28.87Turing202118 W
182NVIDIA Tesla M6028.85Maxwell 2.02015177 USD300 W
183AMD Radeon R9 M290X Crossfire28.45GCN2014200 W
184NVIDIA T100028.45Turing20219 USD50 W
185AMD Radeon Pro 580X28.28GCN 4.020195999 USD150 W
186NVIDIA GeForce GTX 780M SLI28.22Kepler2013149 USD200 W
187AMD Radeon Pro 530028.20RDNA 1.020202599 USD85 W
188NVIDIA Tesla M628.16Maxwell 2.02015350 USD100 W
189AMD Radeon RX 5600M28.01Navi / RDNA2020525 USD150 W
190NVIDIA GeForce GTX 1650 Ti27.96Turing1010 USD75 W
191AMD Radeon R9 290X27.85GCN201324 USD350 W
192AMD Radeon RX 530027.56RDNA 1.020201012 USD100 W
193NVIDIA GeForce GTX 980M27.42Maxwell2014583 USD100 W
194NVIDIA Quadro P200027.26Pascal20171636 USD75 W
195AMD FirePro W810027.13GCN 2.02014795 USD220 W
196NVIDIA GeForce GTX 680M SLI26.14Kepler2012149 USD
197NVIDIA GeForce GTX 1650 (мобильная)26.13Turing2019301 USD50 W
198AMD Radeon RX 57026.13Polaris2017675 USD120 W
199NVIDIA GeForce GTX 1070 Max-Q26.07Pascal20171244 USD115 W
200AMD Radeon RX Vega M GL / 87026.01Vega2018
201NVIDIA Quadro T2000 Max-Q25.94Turing201940 W
202NVIDIA Quadro M5000M25.93Maxwell2015468 USD100 W
203AMD Radeon HD 7970M Crossfire25.51GCN2012126 USD200 W
204AMD Radeon RX 470 (мобильная)25.50Polaris2016148 USD85 W
205AMD Radeon RX Vega M GH25.44Vega20181031 USD100 W
206NVIDIA T60025.38Turing202146 USD40 W
207NVIDIA Quadro M4000M25.10Maxwell2015832 USD100 W
208AMD Radeon R9 28525.05GCN 3.02014240 USD190 W
209NVIDIA Quadro M400024.98Maxwell 2.02015514 USD120 W
210AMD Radeon Pro 5500M24.80Navi / RDNA20191950 USD85 W
211NVIDIA Quadro T100024.32Turing20192035 USD50 W
212NVIDIA Quadro T1000 Max-Q24.30Turing201950 W
213AMD Radeon Pro 57023.76GCN 4.02017157 USD120 W
214NVIDIA GeForce GTX 1050 Ti23.75Pascal2016354 USD70 W
215NVIDIA GeForce GTX 1050 Ti23.75Pascal2016354 USD70 W
216AMD FirePro S715023.54GCN 3.020161683 USD150 W
217NVIDIA GeForce GTX 1650 Ti Max-Q23.42Turing20201183 USD50 W
218AMD Radeon R9 38023.41GCN2015167 USD220 W
219NVIDIA Quadro T2000 (мобильная)23.31Turing20192221 USD60 W
220AMD FirePro W900023.02GCN 1.02012823 USD274 W
221AMD Radeon R9 380X22.98GCN 3.0201516 USD250 W
222AMD Radeon Pro WX Vega M GL22.69Vega20181359 USD65 W
223NVIDIA GeForce GTX 96022.66Maxwell2015238 USD100 W
224NVIDIA P106-10022.38Pascal201715 USD120 W
225AMD Radeon Pro Vega 2022.29Vega2018360 USD100 W
226NVIDIA Quadro K520022.20Kepler2014722 USD150 W
227NVIDIA GeForce GTX 1050 Ti (мобильная)22.20Pascal2017545 USD75 W
228NVIDIA GeForce GTX 1650 Max-Q22.09Turing20191185 USD30 W
229NVIDIA GeForce GTX 970M22.03Maxwell2014848 USD81 W
230NVIDIA GeForce GTX 77022.03Kepler2013230 USD230 W
231AMD Radeon R9 280X21.89GCN201311 USD200 W
232AMD FirePro W710021.73GCN 3.02014715 USD150 W
233AMD Radeon Pro 5300M21.56Navi / RDNA20192068 USD85 W
234NVIDIA Quadro M3000M21.24Maxwell2015981 USD75 W
235NVIDIA GeForce GTX 69021.01Kepler2012569 USD300 W
236AMD Radeon Pro WX 510020.95GCN 4.020161220 USD75 W
237AMD Radeon R9 28020.94GCN 1.0201411 USD200 W
238AMD Radeon HD 799020.87GCN 1.02013619 USD375 W
239NVIDIA GeForce GTX 1050 Ti Max-Q20.64Pascal20181140 USD75 W
240NVIDIA GeForce GTX 68020.58Kepler2012481 USD195 W
241NVIDIA GeForce GTX 760 Ti OEM20.35Kepler2013229 USD170 W
242NVIDIA GeForce GTX 95020.29Maxwell2015320 USD90 W
243AMD Radeon RX Vega 8 (Ryzen 5000)20.15Vega2021
244NVIDIA GeForce GTX 67020.05Kepler2012185 USD170 W
245AMD Radeon RX 560X (мобильная)20.01Polaris2017520 USD65 W
246Intel Iris Xe MAX Graphics19.72Gen. 12 Xe202025 W
247AMD Radeon HD 797019.68GCN2011542 USD250 W
248AMD FirePro S1000019.63GCN 1.02012699 USD375 W
249AMD Radeon R9 M295X19.32GCN 32014250 W
250NVIDIA GeForce GTX 105019.23Pascal2016352 USD60 W
251NVIDIA GeForce GTX 105019.23Pascal2016352 USD60 W
252AMD FirePro S900018.97GCN 1.02012139 USD225 W
253NVIDIA Quadro P2000 Max-Q18.94Pascal2017426 USD
254Intel Iris Xe Graphics G7 96EUs18.87Gen. 11 Ice Lake2020
255AMD Radeon R9 M39518.84GCN20151288 USD
256AMD Radeon HD 6990M Crossfire18.72Terascale 22011170 USD
257NVIDIA GeForce GTX 860M SLI18.62Maxwell2014489 USD120 W
258AMD Radeon R9 270X18.42GCN2013331 USD180 W
259AMD Radeon R9 M390X18.35GCN 3201575 W
260AMD Radeon R9 M485X18.16GCN 320162500 USD250 W
261NVIDIA GeForce GTX 670MX SLI18.11Kepler2012150 W
262NVIDIA GeForce GTX 580M SLI18.07Fermi2011249 USD100 W
263AMD Radeon R9 M395X17.91GCN 3201475 W
264AMD Radeon HD 795017.87GCN 1.02012550 USD200 W
265NVIDIA GeForce GTX 76017.83Kepler2013116 USD170 W
266AMD Radeon Sky 50017.76GCN 1.02013129 USD150 W
267AMD Radeon R9 37017.71GCN 1.02015326 USD110 W
268AMD Radeon Pro Vega 1617.56Vega2018511 USD75 W
269AMD Radeon HD 787017.48GCN2012482 USD200 W
270NVIDIA GeForce GTX 485M SLI17.30Fermi2011149 USD100 W
271NVIDIA GeForce GTX 58016.85Fermi201051 USD244 W
272AMD Radeon RX 550 (мобильная)16.82Polaris2017294 USD50 W
273AMD Radeon RX Vega 8 (Ryzen 4000)16.77Vega2020631 USD
274AMD Radeon HD 7870 XT16.76GCN 1.02012133 USD185 W
275NVIDIA GeForce GTX 1050 (мобильная)16.73Pascal2017256 USD75 W
276NVIDIA Quadro P100016.71Pascal2017301 USD47 W
277NVIDIA P104-10016.69Pascal201722 USD
278AMD Radeon R7 37016.67GCN 1.02015375 USD100 W
279NVIDIA GeForce GTX 770M SLI16.49Kepler2013149 USD150 W
280NVIDIA GeForce GTX 660 Ti16.38Kepler2012448 USD150 W
281AMD Radeon HD 6970M Crossfire16.37Terascale 22011170 USD
282NVIDIA Quadro M220016.30Maxwell20171967 USD55 W
283NVIDIA GeForce GTX 765M SLI16.28Kepler2013149 USD130 W
284NVIDIA Quadro K420016.24Kepler2014282 USD108 W
285NVIDIA GRID M60-2Q16.18Maxwell 2.02015225 W
286AMD Radeon R9 27016.15GCN 1.02013155 USD150 W
287AMD FirePro W700016.03GCN 1.02012321 USD150 W
288NVIDIA GeForce GTX 680MX16.02Kepler2012200 USD122 W
289NVIDIA GRID M60-1Q15.94Maxwell 2.02015225 W
290NVIDIA GeForce GTX 775M15.78Kepler2013780 USD100 W
291AMD FirePro S700015.62GCN 1.02012140 USD150 W
292AMD Radeon RX 560X15.46GCN 4.02018910 USD75 W
293AMD Radeon RX Vega 715.38Vega2020387 USD
294AMD Radeon RX 46015.37Polaris2016208 USD75 W
295AMD Radeon RX 46015.37GCN 4.02016208 USD75 W
296AMD Radeon RX 5500M15.19Navi / RDNA2019998 USD85 W
297NVIDIA GeForce GTX 880M15.15Kepler20141544 USD122 W
298AMD Radeon RX 560 (мобильная)15.07Polaris2017468 USD55 W
299NVIDIA GeForce GTX 66014.97Kepler2012242 USD140 W
300NVIDIA GeForce GTX 965M14.96Maxwell20151546 USD50 W

( Пока оценок нет )

Понравилась статья? Поделиться с друзьями:

Как менялись цены на флагманские видеокарты NVIDIA в 2017 году — Железо на DTF

Редактор сайта PC Gamer проанализировал рост цен на графические адаптеры, вызванный майнингом криптовалют.

{«id»:15099,»type»:»num»,»link»:»https:\/\/dtf.ru\/hard\/15099-kak-menyalis-ceny-na-flagmanskie-videokarty-nvidia-v-2017-godu»,»gtm»:»»,»prevCount»:null,»count»:75,»isAuthorized»:false}

{«id»:15099,»type»:1,»typeStr»:»content»,»showTitle»:false,»initialState»:{«isActive»:false},»gtm»:»»}

{«id»:15099,»gtm»:null}

45 631 просмотров

При помощи сервиса CamelCamelCamel который позволяет отслеживать цены на сайте Amazon, редактор PC Gamer пронаблюдал, как менялась стоимость на видеокарты NVIDIA в течение последних 12 месяцев. Автор исследования пришёл к выводу, что в данный момент ценовую политику видеокарт диктуют сторонние продавцы, так как у основных розничных магазинов уже закончились запасы аппаратного обеспечения.

GTX 1050

Рост цен на чипы линейки GTX 1050 начался летом 2017 года — примерно в то же время владельцы ПК заинтересовались майнингом криптовалюты. На Amazon видеокарты GTX 1050 от компании EVGA начинали продаваться по 130 долларов, а у сторонних продавцов первоначальная стоимость составляла около 150 долларов.

В августе увеличился спрос на графические адаптеры, и цена подскочила до 165 долларов. В данный момент стоимость EVGA GeForce GTX 1050 на Amazon составляет 170 долларов, а в сторонних магазинах цена достигает 200 долларов. На короткий промежуток времени летом 2017 года наблюдались перебои с поставками видеокарт.

Цены на EVGA GeForce GTX 1050

Аналогичная ситуация с комплектующими фирмы GIGABYTE. Изначально цена GeForce GTX 1050 составляла 130 долларов, однако выросла до 150 долларов. У сторонних продавцов стоимость достигала 220 долларов.

Цены на GIGABYTE GeForce GTX 1050

GTX 1060

Ажиотаж вокруг майнинга сказался сильнее на видеокартах серии GTX 1060. При изначальной цене в 240 долларов летом продавцы выставили ценник в 562 доллара. К январю, спустя 17 месяце после выхода видеокарты, цена EVGA GeForce GTX 1060 достигла 650 долларов.

Цены на EVGA GeForce GTX 1060

В отношении графических процессоров GeForce GTX 1060 от GIGABYTE цена подскочила ещё выше. Летом стоимость видеокарт достигала 700 долларов, а к концу 2017 остановилась в районе 460 долларов.

Цены на GIGABYTE GeForce GTX 1060

GTX 1070

Видеокарты GTX 1070 пропали из ассортимента Amazon в середине октября 2017 года. Перед «бумом» майнинга стоимость устройств снизилась до 500-400 долларов, однако в итоге пробила отметку в тысячу долларов. На данный момент GTX 1070 от MSI стоит 882 доллара, а та же видеокарта от EVGA — 950 долларов.

Цены на MSI GeForce GTX 1070

Цены на EVGA GeForce GTX 1070

GTX 1080

Стартовавшая у сторонних продавцов с 750 долларов, к концу года ASUS GeForce GTX 1080 достигла стоимости в 1 099 долларов. При этом весной цена на графические адаптеры упала примерно на 200 долларов, а значительный рост начался в декабре 2017 года. Тогда максимальная стоимость достигала 1 800 долларов. На Amazon видеокарты пропали из ассортимента летом и в начале декабря.

Цены на ASUS GeForce GTX 1080

GTX 1080 от GIGABYTE с июня 2016-го показывала падение цен вплоть до июля прошлого года. Стартовав у сторонних продавцов с 900 долларов, видеокарта GIGABYTE GeForce GTX 1080 примерно за год упала в цене до 500 долларов, а к концу 2017-го вернулась к отметке в тысячу долларов.

Цены на GIGABYTE GeForce GTX 1080

Редакция портала PC Gamer считает, что дальнейшую тенденцию роста цен на видеокарты предсказать довольно сложно. На стоимость влияет множество факторов начиная с производственных объёмов фабрик и заканчивая курсом криптовалют. К тому же текущая ситуация на рынке видеокарт располагает компании увеличивать объёмы производства, а не создавать новые более продвинутые технические устройства.

Рейтинг мощности графического процессора: все текущие видеокарты получили рейтинг

.

Рейтинг производительности графических процессоров Digital Foundry прост: он ранжирует все современные графические карты на рынке от самых мощных до наименее мощных. Наш рейтинг основан на всестороннем реальном тестировании девяти современных и устаревших игр; нет синтетических тестов.

Для каждой карты мы включим среднюю частоту кадров при обычном разрешении и результаты тестов в одной устаревшей игре (Crysis 3) и одной современной игре (Shadow of the Tomb Raider), чтобы вы могли увидеть, как каждая протестированная карта сравнивается с другими в его уровень.Каждая игра тестировалась на самых высоких настройках с разогнанным высокопроизводительным процессором. Если вы хотите увидеть более подробные данные о производительности и посмотреть, как мы тестировали, вы можете найти ссылки на наши полные обзоры и страницы с тестами. Мы также связались с каждой картой на Amazon; переход по этим ссылкам помогает поддержать нашу работу.

В качестве общего примера можно отметить, что средняя частота кадров 60 кадров в секунду обычно считается плавной игрой на пределе возможностей стандартного монитора; 30 кадров в секунду — это скорее консольное качество, а 120 кадров в секунду позволяют вам воспользоваться преимуществами монитора с высокой частотой обновления.

Если вам нужны краткие рекомендации, то вам также стоит прочитать нашу статью о лучших видеокартах 2020 года. Это включает в себя наш текущий выбор самой быстрой видеокарты, видеокарты с лучшим соотношением цены и качества и лучшего бюджетного графического процессора, а также рекомендации для конкретных разрешений экрана и многое другое.

Это подводит итог, так что давайте перейдем к результатам — начнем с текущего рейтинга, где каждая показанная карта сравнивается с лидирующей RTX 2080 Ti.

Старые видеокарты: место

Стоит отметить, что здесь мы сосредоточились на всех текущих графических картах , поэтому модели с сокращающимся запасом были исключены.(Подробнее о том, почему вы можете прочитать в FAQ.) Имея это в виду, вот краткий обзор карт, которые не совсем справились, включая их уровень (с относительной силой по сравнению с RTX 2080 Ti при 1440p), средний fps при три разрешения, ближайший конкурент и ссылка на их полные тесты.

ГП Уровень 1080p 1440p 2160p Ближе всего к… Ссылка
GTX 1080 Ти 1 (78%) 131 кадр/с 94 кадра в секунду 52 кадра в секунду RTX 2080 +2 кадра в секунду Тесты 1080 Ti
Радеон 7 1 (76%) 124 кадров в секунду 92 кадра в секунду 52 кадра в секунду 2070 Супер +0fps Тесты R7
GTX 1080 2 (64%) 108 кадров в секунду 77 кадров в секунду 41 кадр/с RX 5700 +1 кадр/с 1080 тестов
Вега 64 3 (60%) 100 кадров в секунду 73 кадра в секунду 40 кадров в секунду RTX 2060 составляет -2 кадра в секунду Тесты V64
GTX 1070 Ти 3 (57%) 99 кадров в секунду 69 кадров в секунду 37 кадров в секунду RTX 2060 +2 кадра в секунду Тесты 1070 Ti
Вега 56 3 (55%) 94 кадра в секунду 66 кадров в секунду 36 кадров в секунду RTX 2060 +5 кадров в секунду тесты V56
GTX 1070 3 (50%) 88 кадров в секунду 60 кадров в секунду 32 кадра в секунду GTX 1660 Ti составляет -1 кадр/с 1070 тестов
GTX 970 5 (32%) 55 кадров в секунду 38 кадров в секунду Н/Д RX 570 +1 кадр/с Н/Д
GTX 960 4 ГБ 6 (17%) 34 кадра в секунду Н/Д Н/Д RX 560 +1 кадр/с Н/Д

Если вас интересуют только видеокарты определенного уровня, вы можете использовать эти ссылки, чтобы пропустить вперед.

GPU Power Ladder: шесть уровней игровой производительности

  • Уровень 1: RTX 2080 Ti, RTX 2080 Super, RTX 2080, RTX 2070 Super
  • Уровень 2: RX 5700 XT, RTX 2070, RTX 2060 Super, RX 5700
  • Уровень 3: RTX 2060, RX 5600 XT, GTX 1660 Ti, GTX 1660 Super
  • Уровень 4: GTX 1660, RX 590, RX 5500 XT 8 ГБ, RX 5500 XT 4 ГБ
  • Уровень 5: RX 580, GTX 1060, GTX 1650 Super, RX 570
  • Уровень 6: GTX 1650, GTX 1050 Ti, GTX 1050 3 ГБ, RX 560

Уровень 1: RTX 2080 Ti, RTX 2080 Super, RTX 2080, RTX 2070 Super

Этот уровень содержит лучшие потребительские видеокарты на рынке, вплоть до четырехзначной RTX 2080 Ti.Если вы хотите играть в 4K, не жертвуя настройками детализации, это то, что вам нужно. Вот как сравниваются четыре лучших графических процессора.

Crysis 3: очень высокий, SMAA T2X

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Shadow of the Tomb Raider DX12: Высшее, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.


1. Nvidia GeForce RTX 2080 Ti

151 кадр/с 1080p • 121 кадр/с 1440p • 69 кадр/с 4K

RTX 2080 Ti — самая быстрая потребительская видеокарта на рынке со значительным отрывом.(Titan RTX немного быстрее, но эта карта для рабочих станций в два раза дороже.) Обладая огромной мощностью, 2080 Ti также имеет аппаратно-ускоренную трассировку лучей в реальном времени (RTX) и глубокое обучение. суперсэмплинг (DLSS), две перспективные функции, которые в настоящее время поддерживаются только в нескольких играх. Несмотря на то, что RTX 2080 Ti — сильная карта, ее четырехзначный ценник не позволяет рассматривать ее всем, кроме самых богатых сборщиков ПК.


2.Nvidia GeForce RTX 2080 Super

139 кадров в секунду 1080p • 103 кадра в секунду 1440p • 57 кадров в секунду 4K

RTX 2080 Super заметно лучше RTX 2080, GTX 1080 Ti и RTX 2070 Super, но не бросает вызов превосходству RTX 2080 Ti. Как и другие карты RTX, он включает в себя специальное оборудование для трассировки лучей и глубокого обучения, а также такие тонкости, как порт USB-C для гарнитур виртуальной реальности (и, действительно, почти все, что подключается через USB-C). Эта карта заменяет RTX 2080 по той же рекомендованной розничной цене.


3. Nvidia GeForce RTX 2080

133 кадра в секунду 1080p • 97 кадров в секунду 1440p • 54 кадра в секунду 4K

RTX 2080 обеспечивает немного лучшую производительность, чем флагманская карта Nvidia последнего поколения, GTX 1080 Ti. Эта карта была заменена на RTX 2080 Super, но запасы по-прежнему широко доступны, а временное снижение цен означает, что карта по-прежнему является жизнеспособным вариантом. Просто убедитесь, что вы не можете получить RTX 2080 Super за те же деньги!


4. Nvidia GeForce RTX 2070 Super

128 кадров в секунду 1080p • 92 кадра в секунду 1440p • 50 кадров в секунду 4K

RTX 2070 Super — это замена RTX 2070, предлагающая повышенную производительность по той же цене.Карта идеально подходит для игр с разрешением 1080p и 1440p, но 4K также доступен с помощью всего нескольких настроек. Как и в случае с другими картами RTX, функции трассировки лучей с аппаратным ускорением и суперсэмплирования с глубоким обучением (DLSS) могут повысить ценность, если вы играете в игры, которые их поддерживают.


Уровень 2: RX 5700 XT, RTX 2070, RTX 2060 Super, RX 5700

Эти карты не самые быстрые из доступных, но они по-прежнему обеспечивают превосходную производительность и стоят намного меньше, чем ведущие карты. Ожидайте, что во многих играх вы сможете растягиваться до 4K, но 1440p или 1080p с высокой частотой обновления — это лучшее место.Вот сравнение этой четверки видеокарт:

Crysis 3: очень высокий, SMAA T2X

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Shadow of the Tomb Raider DX12: Высшее, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.


5. AMD Radeon RX 5700 XT

120 кадров в секунду 1080p • 86 кадров в секунду 1440p • 46 кадров в секунду 4K

RX 5700 XT использует новую архитектуру RDNA от AMD и тот же 7-нм техпроцесс, который дебютировал в Radeon 7, обеспечивая удивительное количество лошадиных сил по скромной цене.Карта потребляет больше энергии, чем ее младший брат RX 5700, но лучше масштабируется до более высоких разрешений благодаря улучшенной производительности.


6. Nvidia GeForce RTX 2070

115 кадров в секунду 1080p • 82 кадра в секунду 1440p • 44 кадра в секунду 4K

RTX 2070 обеспечивает хорошую производительность при разрешении 1080p и 1440p, а также может работать в 4K в современных играх, если вы хотите уменьшить некоторые графические настройки. Это немного быстрее, чем старая GTX 1080. Сочетание цены и производительности RTX 2070 сделало ее самой популярной картой RTX в обзоре оборудования Steam, но ожидайте, что она уменьшится теперь, когда пришла ее замена.Тем не менее, карты RTX 2070 по-прежнему доступны в большом количестве, и новое снижение цен может сделать их хорошим выбором — просто проверьте цены 2070 Super!


7. Nvidia GeForce RTX 2060 Super

113 кадров в секунду 1080p • 80 кадров в секунду 1440p • 43 кадра в секунду 4K

RTX 2060 Super — отличный выбор для игр с разрешением 1080p и 1440p, занимающий ту же ценовую категорию, что и старая RTX 2060, но предлагающий больше видеопамяти (8 ГБ против 6 ГБ) и повышенную вычислительную мощность. Это делает эту карту более перспективной, чем ее предшественница.Тем не менее, RTX 2060 по-прежнему продается по более низкой цене, обеспечивая лучшее соотношение цены и производительности — по крайней мере, в краткосрочной перспективе.


8. AMD Радеон РХ 5700

109 кадров в секунду 1080p • 77 кадров в секунду 1440p • 42 кадра в секунду 4K

RX 5700 — еще одна новая карта от AMD, использующая 7-нм техпроцесс и усовершенствованную архитектуру RDNA для обеспечения превосходной производительности 1080p и 1440p по разумной цене. Vanilla RX 5700 работает более эффективно, чем модель XT, но не так сильно ворчит.Тем не менее, отчеты предполагают, что можно прошить RX 5700 XT BIOS на обычную модель, что может открыть дополнительную производительность. Мы не пробовали это и не рекомендуем, так как вы можете получить кирпич, но, тем не менее, это интересно.


Уровень 3: RTX 2060, RX 5600 XT, GTX 1660 Ti, GTX 1660 Super

Этот конкурентоспособный уровень хорошо работает в разрешении 1440p и 1080p без необходимости снижать настройки детализации во всех играх, кроме самых требовательных. Здесь также находится самая дешевая карта с аппаратным ускорением трассировки лучей и DLSS — RTX 2060.Недавнее удаление Vega 56 и Vega 64 означает, что лучшие из последних карт Nvidia GTX поднимаются на уровень выше в нашем рейтинге, предоставляя крайне необходимое место на переполненных нижних уровнях лестницы мощности.

Здесь также дебютирует RX 5600 XT. Это сильная карта, но ситуация сложная — обновление BIOS, навязанное AMD за несколько дней до запуска, означает, что некоторые модели существенно мощнее, чем другие, с 12-гигабитной памятью, увеличенной до 14-гигабитной, а также повышенными тактовыми частотами.Ознакомьтесь с полным обзором RX 5600 XT или ознакомьтесь со списком различных моделей RX 5600 XT от AMD.

Crysis 3: очень высокий, SMAA T2X

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Shadow of the Tomb Raider DX12: Высшее, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.


9. Nvidia GeForce RTX 2060

102 кадров/с 1080p • 71 кадр/с 1440p • 37 кадров/с 4K

RTX 2060 занимает уникальное место в линейке Nvidia, будучи самой дешевой картой с аппаратным ускорением трассировки лучей.Он также хорошо работает, особенно в новых играх, с хорошими результатами в 1080p и 1440p. Более низкая загрузка ЦП означает, что RTX 2060 на самом деле работает лучше в играх с разрешением 1080p, чем Vega 64, хотя и проигрывает карте AMD при более высоких разрешениях. RTX 2060 недавно получила постоянное снижение цены благодаря представлению более быстрой RTX 2060 Super, что делает ее отличным выбором для игр с разрешением 1080p и 1440p с поддержкой RTX и DLSS.


10. AMD Radeon RX 5600 XT

97 кадров в секунду 1080p • 68 кадров в секунду 1440p • 36 кадров в секунду 4K

Эта карта находится между RX 5500 XT и RX 5700, обеспечивая высокую производительность 1080p и достойную частоту кадров 1440p.RX 5600 XT — захватывающий продукт благодаря последнему обновлению BIOS, которое существенно повышает производительность — с тактовой частотой 1750 МГц и эффективной скоростью памяти 14 Гбит/с по сравнению с 1620 МГц и 12 Гбит/с у эталонного продукта. По этой причине стоит выбрать модель OC, если цена близка к отметке в 299 долларов. Обратите внимание, что наша средняя частота кадров здесь основана на эталонной модели; средние значения модели OC составляют 102 кадра в секунду при 1080p, 72 кадра в секунду при 1440p и 38 кадров в секунду при 4K. Ознакомьтесь с обзором по ссылке ниже, чтобы более подробно изучить производительность между двумя вариантами, и обязательно ознакомьтесь с разбивкой AMD о том, какие модели требуют обновления BIOS для работы на полной скорости, поставляются с установленными обновлениями BIOS или не сертифицированы для работы на максимальной скорости. более высокие скорости.


11. Nvidia GeForce GTX 1660 Ti

88 кадров/с 1080p • 60 кадров/с 1440p • 31 кадр/с 4K

GTX 1660 Ti — необычная карта, предлагающая некоторые преимущества архитектуры Nvidia Turing без специального оборудования для машинного обучения или трассировки лучей. В результате получается более дешевая карта, способная превзойти GTX 1070 в современных играх, но отставать в старых.


12. Nvidia GeForce GTX 1660 Super

85 кадров в секунду 1080p • 59 кадров в секунду 1440p • 30 кадров в секунду 4K

GTX 1660 Super — улучшенная версия оригинальной GTX 1660 с более быстрой памятью GDDR6.75-процентное увеличение тактовой частоты памяти делает эту карту примерно на 15 процентов быстрее в большинстве протестированных нами игр, что позволяет ей действительно приблизиться к более дорогой GTX 1660 Ti. Это означает, что вы должны выбрать ту карту, которая дешевле в вашем регионе — возможно, Super.


Уровень 4: GTX 1660, RX 590, RX 5500 XT 8 ГБ, RX 5500 XT 4 ГБ

Этот новый уровень сформирован квартетом недавно выпущенных карт от Nvidia и AMD, включая две модели RX 5500, появившиеся в конце 2019 года.Играть в играх с разрешением 1440p становится все труднее, не жертвуя визуальной точностью, но производительность 1080p по-прежнему превосходна.

Crysis 3: очень высокий, SMAA T2X

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Shadow of the Tomb Raider DX12: Высшее, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.


13. Nvidia GeForce GTX 1660

74 кадра в секунду 1080p • 51 кадр в секунду 1440p • 26 кадров в секунду 4K

GTX 1660 близка к AMD RX 590, при этом карта AMD оказывается сильнее в 4K, но Team Green имеет небольшое преимущество в 1080p и 1440p.Тем не менее, это небольшая маржа, легко находящаяся в пределах погрешности, поэтому выбор на основе цены или характеристик может иметь больше смысла.


14. AMD Радеон RX 590

73 кадра в секунду 1080p • 50 кадров в секунду 1440p • 26 кадров в секунду 4K

RX 590 конкурирует с GTX 1660 в нижнем среднем диапазоне, предлагая высокую производительность 1080p и разумные результаты 1440p. Карта «обновление за обновлением» не предлагает много нового с точки зрения функций, но используемый 12-нм техпроцесс позволяет работать на более высоких тактовых частотах без дополнительного нагрева или энергопотребления — неплохое сочетание!


15.AMD Radeon RX 5500 XT 8 ГБ

72 кадра в секунду 1080p • 50 кадров в секунду 1440p • 26 кадров в секунду 4K

RX 5500 XT — долгожданный преемник RX 580, работающий в аналогичном диапазоне производительности с использованием более совершенной архитектуры AMD RDNA и 7-нанометрового техпроцесса. Это означает немного лучшую частоту кадров, чем у старых RX 580 и RX 570, при меньшем энергопотреблении и меньшем нагреве. Версия карты на 8 ГБ также более надежна, чем ее брат на 4 ГБ, что дает вам возможность играть в более высоких разрешениях и с более высокими настройками текстур без нехватки видеопамяти и сильного удара по частоте кадров.Однако, если реальная игровая производительность — это все, что вас волнует, то удешевленная карта RX 500-й серии на 8 ГБ может по-прежнему предлагать более выгодную цену … пока есть в наличии.


16. AMD Radeon RX 5500 XT 4 ГБ

69 кадров в секунду 1080p • 47 кадров в секунду 1440p • 24 кадра в секунду 4K

4-гигабайтная версия RX 5500 XT имеет вдвое меньший объем видеопамяти, чем его старший брат, но в остальном она идентична, поэтому вы можете ожидать такой же производительности в большинстве игр. Однако, как только у вас заканчивается видеопамять, производительность сильно снижается, поэтому мы рекомендуем по возможности придерживаться более низких настроек текстур и более низкого разрешения.Это делает карту на 4 ГБ немного менее перспективной, чем альтернатива на 8 ГБ, но, учитывая разницу в цене, более дешевая карта предлагает лучшее соотношение цены и качества для игр с разрешением 1080p.


Уровень 5: RX 580, GTX 1060, GTX 1650 Super, RX 570

Теперь мы надежно в мейнстриме, предлагая карты с лучшим соотношением цены и качества на рынке. GTX 1060 является самым популярным графическим процессором со значительным отрывом, но агрессивная цена от AMD означает, что RX 580 и RX 570 могут быть лучшим выбором. Между тем, новая GTX 1650 Super немного не впечатляет, в основном предлагая худшую производительность, чем RX 5500 XT 4 ГБ, выпущенная почти в то же время.

Crysis 3: очень высокий, SMAA T2X

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Shadow of the Tomb Raider DX12: Высшее, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.


17. AMD Радеон RX 580

66 кадров в секунду 1080p • 46 кадров в секунду 1440p • 24 кадра в секунду 4K

RX 580 — лучшая видеокарта для игр с разрешением 1080p, превосходящая GTX 1060 с небольшим, но значительным отрывом и часто продаваемая по более низкой цене.Игры с разрешением 1440p тоже возможны, но вам придется пожертвовать настройками качества, чтобы обеспечить воспроизводимую игру со скоростью 60 кадров в секунду.


18. Nvidia GeForce GTX 1060 6 ГБ

64 кадра в секунду 1080p • 44 кадра в секунду 1440p • 23 кадра в секунду 4K

GTX 1060 доступна как в вариантах с 3 ГБ, так и с 6 ГБ, результаты здесь показаны для версии 6 ГБ, которую мы рекомендуем. Эта видеокарта едва ли уступает RX 580 в совокупности, но обе карты могут лидировать в определенных играх — аппаратное обеспечение Nvidia лучше всего работает на DX11, в то время как AMD имеет преимущество в играх DX12 и Vulkan.


19. Nvidia GeForce GTX 1650 Супер

66 кадров/с 1080p • 43 кадра/с 1440p • 21 кадр/с 4K

GTX 1650 Super немного быстрее старой GTX 1060 в разрешении 1080p, но отстает при увеличении разрешения. Учитывая, что ее производительность значительно отстает от RX 5500 XT, еще одной новой карты, доступной по аналогичной цене, нет особых причин выбирать эту карту по сравнению с ее конкурентами. Тем не менее, Nvidia доказала свою готовность агрессивно снижать цены на свои карты, поэтому при правильной цене 1650 Super может стать более жизнеспособной альтернативой доминированию AMD на низком уровне.


20. AMD Radeon RX 570 4 ГБ

58 кадров в секунду 1080p • 40 кадров в секунду 1440p

Эта урезанная версия RX 570 по-прежнему хорошо работает в разрешении 1080p, конкурируя с 3-гигабайтной версией GTX 1060 по частоте кадров. Тем не менее, его можно разогнать до уровня производительности, близкого к RX 580, что значительно повысит его ценность для победителей кремниевой лотереи. Недавнее снижение цен сделало этот выбор выдающимся.


Уровень 6: GTX 1650, GTX 1050 Ti, GTX 1050 3 ГБ, RX 560

Эти карты начального уровня предназначены для игр с разрешением 1080p и обеспечивают приемлемую производительность по очень низкой цене.Более дорогие карты обеспечат немного большую продолжительность жизни и возможность игр с разрешением 1440p, но если у вас ограниченный бюджет, это лучше, чем возможно. Не забудьте также проверить цены на следующий уровень, так как недавние скидки могут привести к появлению гораздо более производительных моделей, таких как RX 570.

Crysis 3: очень высокий, SMAA T2X

Включите JavaScript, чтобы использовать наши инструменты сравнения.

Shadow of the Tomb Raider DX12: Высшее, TAA

Включите JavaScript, чтобы использовать наши инструменты сравнения.


21. Nvidia GeForce GTX 1650

48 кадр/с 1080p • 32 кадр/с 1440p

GTX 1650 — самый слабый продукт, выпущенный Nvidia за последнее время. Он стоит столько же, сколько конкурирующий RX 570, но предлагает значительно худшую производительность в большинстве игр. В то время как однослотовые конструкции с низким энергопотреблением (и отсутствие необходимости в дополнительном питании PCI-e) могут стать хорошим решением для тех, кто хочет обновить офисную башню для игр, всем остальным следует держаться подальше.


22. Nvidia GeForce GTX 1050 Ti

42 кадра в секунду 1080p • 27 кадров в секунду 1440p

GTX 1050 Ti — самая быстрая карта начального уровня на рынке, обеспечивающая достойную производительность 1080p с большим объемом видеопамяти, что предотвращает проблемы в таких играх, как Battlefield 1. в современных играх.


23. Nvidia GeForce GTX 1050 3 ГБ

36 кадров в секунду 1080p • 23 кадра в секунду 1440p

Ранее мы назвали GTX 1050 3 ГБ нашей любимой бюджетной картой на рынке благодаря достойной производительности 1080p, низкому энергопотреблению и цене начального уровня.Хотя существуют версии этих карт на 2 ГБ и 3 ГБ, их становится все труднее найти в наличии по мере выпуска новых моделей.


24. AMD Radeon RX 560 4 ГБ

34 кадра/с 1080p • 21 кадр/с 1440p

RX 560 — это запутанная карта, предлагаемая в излишне большом количестве вариантов с различными вычислительными блоками (CU), видеопамятью, тактовыми частотами, требованиями к питанию и многим другим. Даже в лучшем случае, представленном этими тестами — версия карты на 4 ГБ с полным набором 16 CU — производительность здесь действительно не о чем говорить.


Часто задаваемые вопросы

Почему моей видеокарты нет в этом списке?

Обратите внимание, что мы выбрали видеокарты выборочно по нескольким причинам. Что наиболее важно, рейтинг основан на средней производительности при разрешении 1440p в девяти различных играх, которые мы некоторое время использовали в качестве ориентиров. Тем не менее, некоторые старые видеокарты не тестировались в более поздних играх, таких как Shadow of the Tomb Raider и Assassin’s Creed Odyssey, поэтому любое среднее значение, которое мы получили, несопоставимо.Повторное тестирование этих старых карт устранило бы эту проблему, но с таким количеством возможных кандидатов это было бы серьезной задачей.

Есть также некоторые карты, например несколько моделей серии GTX 10, для которых у нас есть данные, но мы не включили их в этот список. Частично это связано с удобством чтения — мы не хотим, чтобы эта страница со временем становилась все более длинной и громоздкой по мере выпуска новых графических процессоров, потому что старые графические процессоры никогда не исчезают. Вместо этого мы решили включать только те видеокарты, которые широко доступны в новом состоянии в США и Великобритании по справедливой цене.

Для моделей, которые не попали в список, мы составили шпаргалку в верхней части этой страницы со сводкой имеющихся у нас данных, к какому уровню они относятся и какие карты наиболее близки похожи по исполнению. Обратите внимание, что среднее значение может быть немного обманчивым — наше тестирование показывает, что GTX 1660 Ti быстрее, чем GTX 1070 в новых играх, но медленнее в старых играх, поэтому здесь есть разница в производительности, несмотря на то, что в среднем работает примерно так же быстро. . Мы также связались с полными страницами тестов, где они существуют, чтобы вы могли более подробно увидеть, как работают эти карты.

Можно ли посмотреть график с реальными значениями fps?

Конечно, вот.


Мы надеемся, что эта шкала мощности графического процессора оказалась полезной! Мы планируем обновлять эту страницу с течением времени, когда выпускаются новые видеокарты, а старые видеокарты исчезают с рынка, так что следите за обновлениями! А пока почему бы не ознакомиться с нашими текущими рекомендациями по лучшим видеокартам на рынке?

Лучший графический процессор для глубокого обучения

Лучший графический процессор для глубокого обучения

Традиционно этап обучения конвейера глубокого обучения занимает больше всего времени.Это не только трудоемкий процесс, но и дорогостоящий. Наиболее ценной частью конвейера глубокого обучения является человеческий фактор: специалисты по данным часто часами или днями ждут завершения обучения, что снижает их производительность и время, необходимое для вывода новых моделей на рынок.

Чтобы значительно сократить время обучения, вы можете использовать графические процессоры для глубокого обучения, которые позволяют выполнять вычислительные операции ИИ параллельно. При оценке графических процессоров необходимо учитывать возможность соединения нескольких графических процессоров, доступное вспомогательное программное обеспечение, лицензирование, параллелизм данных, использование памяти и производительность графического процессора.

Из этой статьи вы узнаете:

Почему графические процессоры важны для глубокого обучения?

Самая продолжительная и ресурсоемкая фаза большинства реализаций глубокого обучения — фаза обучения. Эта фаза может быть выполнена за разумное количество времени для моделей с меньшим количеством параметров, но по мере увеличения вашего числа увеличивается и время обучения. Это имеет двойную стоимость; ваши ресурсы заняты дольше, и ваша команда остается ждать, тратя драгоценное время.

Графические процессоры (GPU) могут снизить эти затраты, позволяя быстро и эффективно запускать модели с огромным количеством параметров. Это связано с тем, что графические процессоры позволяют распараллеливать задачи обучения, распределяя задачи по кластерам процессоров и одновременно выполняя вычислительные операции. Графические процессоры

также оптимизированы для выполнения целевых задач, выполняя вычисления быстрее, чем неспециализированное оборудование. Эти процессоры позволяют быстрее выполнять одни и те же задачи и освобождать ЦП для других задач.Это устраняет узкие места, создаваемые ограничениями вычислительных ресурсов.

Как выбрать лучший графический процессор для глубокого обучения?

Выбор графических процессоров для вашей реализации имеет значительные последствия для бюджета и производительности. Вам необходимо выбрать графические процессоры, которые могут поддерживать ваш проект в долгосрочной перспективе и иметь возможность масштабирования за счет интеграции и кластеризации. Для крупномасштабных проектов это означает выбор графических процессоров производственного уровня или центров обработки данных.

Факторы GPU, которые следует учитывать

Эти факторы влияют на масштабируемость и простоту использования выбранных вами GPU.

Возможность соединения графических процессоров

При выборе графического процессора необходимо учитывать, какие блоки могут быть соединены между собой. Взаимосвязь графических процессоров напрямую связана с масштабируемостью вашей реализации и возможностью использования нескольких графических процессоров и стратегий распределенного обучения.

Как правило, потребительские графические процессоры не поддерживают взаимосвязь (NVlink для межсоединений графических процессоров внутри сервера и Infiniband/RoCE для связывания графических процессоров между серверами), и NVIDIA удалила межсоединения на графических процессорах ниже RTX 2080.

Вспомогательное программное обеспечение

Графические процессоры NVIDIA поддерживаются лучше всего с точки зрения библиотек машинного обучения и интеграции с распространенными платформами, такими как PyTorch или TensorFlow. Набор инструментов NVIDIA CUDA включает в себя библиотеки с ускорением на GPU, компилятор и среду выполнения C и C++, а также средства оптимизации и отладки. Это позволяет вам сразу приступить к работе, не беспокоясь о создании пользовательских интеграций.

Узнайте больше в наших руководствах по графическим процессорам PyTorch и графическим процессорам NVIDIA для глубокого обучения.

Лицензирование

Другим фактором, который следует учитывать, является руководство NVIDIA по использованию определенных чипов в центрах обработки данных. После обновления лицензии в 2018 году могут быть ограничения на использование программного обеспечения CUDA с потребительскими графическими процессорами в центре обработки данных. Это может потребовать от организаций перехода на графические процессоры производственного уровня.

3 Факторы алгоритма, влияющие на использование графического процессора

Исходя из нашего опыта помощи организациям в оптимизации крупномасштабных рабочих нагрузок глубокого обучения, ниже приведены три ключевых фактора, которые следует учитывать при масштабировании алгоритма на нескольких графических процессорах.

  1. Параллелизм данных — Подумайте, сколько данных необходимо обработать вашим алгоритмам. Если наборы данных будут большими, инвестируйте в графические процессоры, способные эффективно выполнять обучение с несколькими графическими процессорами. Для очень больших наборов данных убедитесь, что серверы могут очень быстро взаимодействовать друг с другом и с компонентами хранилища, используя такие технологии, как Infiniband/RoCE, чтобы обеспечить эффективное распределенное обучение.
  2. Использование памяти — Собираетесь ли вы иметь дело с большими входными данными для модели? Например, модели, обрабатывающие медицинские изображения или длинные видеоролики, имеют очень большие обучающие наборы, поэтому вам следует инвестировать в графические процессоры с относительно большим объемом памяти.Напротив, табличные данные, такие как ввод текста для моделей НЛП, обычно имеют небольшой размер, и вы можете обойтись меньшим объемом памяти графического процессора.
  3. Производительность графического процессора — Подумайте, собираетесь ли вы использовать графические процессоры для отладки и разработки. В этом случае вам не понадобятся самые мощные графические процессоры. Для настройки моделей в длительных прогонах вам нужны мощные графические процессоры, чтобы ускорить время обучения, чтобы избежать часов или дней ожидания запуска моделей.

Использование потребительских графических процессоров для глубокого обучения

Хотя потребительские графические процессоры не подходят для крупномасштабных проектов глубокого обучения, эти процессоры могут стать хорошей отправной точкой для глубокого обучения.Потребительские графические процессоры также могут быть более дешевым дополнением для менее сложных задач, таких как планирование моделей или низкоуровневое тестирование. Однако по мере масштабирования вы захотите рассмотреть возможность использования графических процессоров уровня центра обработки данных и высокопроизводительных систем глубокого обучения, таких как серия NVIDIA DGX (подробнее см. в следующих разделах).

В частности, было показано, что Titan V обеспечивает производительность, аналогичную графическим процессорам уровня центра обработки данных, когда речь идет о Word RNN. Кроме того, его производительность для CNN лишь немного ниже вариантов более высокого уровня.Titan RTX и RTX 2080 Ti не сильно отстают.

NVIDIA Titan V

Titan V — это графический процессор для ПК, разработанный для использования учеными и исследователями. Он основан на технологии NVIDIA Volta и включает тензорные ядра. Titan V выпускается в версиях Standard и CEO.

Стандартная версия обеспечивает 12 ГБ памяти, производительность 110 терафлопс, 4,5 МБ кэш-памяти второго уровня и 3072-битную шину памяти. Версия CEO обеспечивает 32 ГБ памяти и производительность 125 терафлопс, 6 МБ кэш-памяти и 4096-битную шину памяти.В последнем выпуске также используются те же стеки памяти 8-Hi HBM2, что и в устройствах Tesla на 32 ГБ.

NVIDIA Titan RTX

Titan RTX — это графический процессор для ПК, основанный на архитектуре NVIDIA Turing GPU, предназначенный для творческих задач и задач машинного обучения. Он включает технологии Tensor Core и RT Core, обеспечивающие трассировку лучей и ускоренный ИИ.

Каждый Titan RTX обеспечивает 130 терафлопс, 24 ГБ памяти GDDR6, 6 МБ кэш-памяти и 11 GigaRays в секунду. Это связано с 72 ядрами Turing RT и 576 тензорными ядрами Turing повышенной точности.

NVIDIA GeForce RTX 2080 Ti

GeForce RTX 2080 Ti — это графический процессор для ПК, разработанный для энтузиастов. Он основан на графическом процессоре TU102. Каждая GeForce RTX 2080 Ti имеет 11 ГБ памяти, 352-битную шину памяти, 6 МБ кэш-памяти и производительность примерно 120 терафлопс.

Лучшие графические процессоры для глубокого обучения для крупномасштабных проектов и центров обработки данных

Ниже приведены графические процессоры, рекомендуемые для использования в крупномасштабных проектах ИИ.

NVIDIA Tesla A100

A100 — это графический процессор с тензорными ядрами, который включает в себя технологию многоэкземплярного графического процессора (MIG).Он был разработан для машинного обучения, анализа данных и высокопроизводительных вычислений.

Tesla A100 предназначена для масштабирования до тысяч единиц и может быть разделена на семь экземпляров графического процессора для рабочей нагрузки любого размера. Каждый Tesla A100 обеспечивает производительность до 624 терафлопс, 40 ГБ памяти, пропускную способность памяти 1555 ГБ и межсоединения 600 ГБ/с.

NVIDIA Tesla V100

NVIDIA Tesla V100 — это графический процессор с тензорными ядрами, разработанный для машинного обучения, глубокого обучения и высокопроизводительных вычислений (HPC).Он основан на технологии NVIDIA Volta, которая поддерживает технологию тензорного ядра, предназначенную для ускорения обычных тензорных операций в глубоком обучении. Каждый Tesla V100 обеспечивает производительность 149 терафлопс, до 32 ГБ памяти и 4096-битную шину памяти.

NVIDIA Tesla P100

Tesla P100 — это графический процессор на основе архитектуры NVIDIA Pascal, предназначенный для машинного обучения и высокопроизводительных вычислений. Каждый P100 обеспечивает производительность до 21 терафлопс, 16 ГБ памяти и 4096-битную шину памяти.

NVIDIA Tesla K80

Tesla K80 — это графический процессор на базе архитектуры NVIDIA Kepler, предназначенный для ускорения научных вычислений и анализа данных. Он включает 4992 ядра NVIDIA CUDA и технологию GPU Boost™. Каждый K80 обеспечивает производительность до 8,73 терафлопс, 24 ГБ памяти GDDR5 и пропускную способность памяти 480 ГБ.

TPU Google

Блоки тензорной обработки Google (TPU) немного отличаются. TPU — это микросхемы или облачные специализированные интегральные схемы (ASIC) для глубокого обучения.Эти модули специально разработаны для использования с TensorFlow и доступны только на Google Cloud Platform.

Каждый TPU может обеспечить производительность до 420 терафлопс и 128 ГБ памяти с высокой пропускной способностью (HBM). Также доступны версии pod, которые могут обеспечить производительность более 100 петафлопс, 32 ТБ HBM и двухмерную тороидальную ячеистую сеть.

L Заработайте больше в нашем руководстве по графическим процессорам TensorFlow.

NVIDIA DGX для глубокого обучения в больших масштабах

Системы NVIDIA DGX представляют собой полностековые решения, разработанные для машинного обучения корпоративного уровня.Эти системы основаны на программном стеке, оптимизированном для ИИ, многоузловой масштабируемости и поддержки корпоративного уровня.

Вы можете реализовать стек DGX в контейнерах или на голом железе. Эта технология предназначена для работы по принципу plug-n-play и полностью интегрирована с библиотеками глубокого обучения и программными решениями NVIDIA. DGX доступен для рабочих станций, серверов или модулей серверного класса. Ниже представлены параметры сервера.

DGX-1

DGX-1 — это сервер с графическим процессором, основанный на операционной системе Ubuntu Linux Host.Он интегрируется с решениями Red Hat и включает в себя обучающее приложение для глубокого обучения DIGITS, SDK NVIDIA для глубокого обучения, набор инструментов CUDA и утилиту Docker Engine для графического процессора NVIDIA.

Каждый DGX-1 включает:

  • Два процессора Intel Xeon для координации среды глубокого обучения, загрузки и управления хранилищем
  • До 8 графических процессоров Tesla V100 Tensor Cores с 32 ГБ памяти /s с низкой задержкой
  • Один 480 ГБ загрузочный SSD для ОС и четыре 1.Твердотельные накопители SAS емкостью 92 ТБ (всего 7,6 ТБ), сконфигурированные как чередующийся том RAID 0

DGX-2

DGX-2 — это следующий уровень по сравнению с DGX-1. Он основан на сетевой структуре NVSwitch для большей параллелизма и масштабируемости.

Каждый DGX-2 обеспечивает:

  • Два петафлопса производительности
  • 2 твердотельных накопителя NVME емкостью 960 ГБ для хранения ОС и 30 ТБ хранилища SSD
  • 16 GPU Tesla V100 Tensor Core с 32 ГБ памяти
  • 1
  • 1Полоса пропускания 4 ТБ/с для разделения пополам
  • 1,6 ТБ/с с малой задержкой, двунаправленная пропускная способность
  • 1,5 ТБ системной памяти
  • Два процессора Xeon Platinum для координации, загрузки и хранения среды глубокого обучения
  • Два высокоскоростных порта ввода-вывода Ethernet карты

DGX A100

DGX A100 разработан как универсальная система для рабочих нагрузок машинного обучения, включая аналитику, обучение и логические выводы. Он полностью оптимизирован для CUDA-X. DGX A100 можно объединять с другими устройствами A100 для создания массивных кластеров ИИ, включая NVIDIA DGX SuperPOD.

Каждый DGX A100 обеспечивает:

  • Пять петафлопс производительности
  • Восемь графических процессоров A100 Tensor Core с 40 ГБ памяти
  • Шесть NVSwitch для двунаправленной полосы пропускания 4,8 ТБ направленная пропускная способность
  • Два 64-ядерных процессора AMD для координации, загрузки и хранения среды глубокого обучения
  • 1 ТБ системной памяти
  • 2 диска M.2 NVME по 1,92 ТБ для хранения ОС и 15 ТБ для хранения SSD

Какой графический процессор лучше для глубокого обучения?

К сожалению, простого ответа нет.Выбор лучшего графического процессора для вашего проекта будет зависеть от зрелости вашей операции ИИ, масштаба, в котором вы работаете, а также от конкретных алгоритмов и моделей, с которыми вы работаете. В предыдущих разделах мы предоставили множество соображений, которые могут помочь вам выбрать графический процессор или набор графических процессоров, которые лучше всего подходят для ваших нужд.

Автоматизированное управление GPU для глубокого обучения с помощью Run:ai

Run:AI автоматизирует управление ресурсами и оркестровку рабочей нагрузки для инфраструктуры машинного обучения. С помощью Run:AI вы можете автоматически запускать столько экспериментов с интенсивными вычислениями, сколько необходимо.

Вот некоторые из возможностей, которые вы получаете при использовании Run:AI:

  • Расширенная видимость — создайте эффективный конвейер совместного использования ресурсов путем объединения вычислительных ресурсов графического процессора.
  • Больше никаких узких мест — вы можете настроить гарантированные квоты ресурсов GPU, чтобы избежать узких мест и оптимизировать биллинг.
  • Более высокий уровень контроля —Run:AI позволяет динамически изменять распределение ресурсов, гарантируя, что каждое задание получит необходимые ресурсы в любой момент времени.

Run:AI ускоряет глубокое обучение на графическом процессоре, помогая специалистам по данным оптимизировать дорогостоящие вычислительные ресурсы и повышать качество своих моделей.

Узнайте больше о платформе виртуализации графических процессоров Run.ai.

См. наши дополнительные руководства по ключевым темам инфраструктуры искусственного интеллекта

Мы разработали подробные руководства по нескольким другим темам инфраструктуры искусственного интеллекта, которые также могут быть полезны при изучении мира графических процессоров для глубокого обучения.

MLOps

В сегодняшней высококонкурентной экономике предприятия обращаются к искусственному интеллекту в целом и машинному и глубокому обучению в частности, чтобы преобразовать большие данные в действенные идеи, которые могут помочь им лучше обращаться к своей целевой аудитории, улучшать свои процессы принятия решений, и оптимизировать свои цепочки поставок и производственные процессы, и это лишь некоторые из многих возможных вариантов использования. Однако, чтобы оставаться на шаг впереди и в полной мере использовать ML, компании должны стратегически использовать MLOps.

См. основные статьи в нашем руководстве по MLOps:

Kubernetes и ИИ

В этом руководстве объясняется архитектура Kubernetes для рабочих нагрузок ИИ и то, как K8 стали использоваться во многих компаниях. Существуют определенные соображения по внедрению Kubernetes для управления рабочими нагрузками ИИ. Наконец, в руководстве рассматриваются недостатки Kubernetes, когда речь идет о планировании и оркестровке рабочих нагрузок глубокого обучения, а также способы устранения этих недостатков.

См. лучшие статьи в нашем руководстве Kubernetes для ИИ:

Сравнение HD-графики Intel — руководство по интегрированным графическим процессорам 2018 г.

Каждый ноутбук имеет встроенный в процессор GPU (графический процессор).И если, как и подавляющее большинство ноутбуков, компьютер оснащен процессором Intel, он имеет встроенную графику Intel HD Graphics или Iris Graphics.

Если вы хотите играть в высококлассные игры или серьезно заниматься 3D-моделированием, вам нужен ноутбук с более мощным дискретным графическим чипом от Nvidia или AMD, который заменяет графический процессор Intel при запуске ресурсоемких графических процессоров. программы. Тем не менее, большинство обычных пользователей могут получить достаточно хорошую производительность от встроенной графики Intel.

В зависимости от Intel HD или Iris Graphics и процессора, с которым он поставляется, вы можете запускать некоторые из ваших любимых игр, но не на самых высоких настройках.Более того, встроенные графические процессоры, как правило, меньше нагреваются и более энергоэффективны. Вот несколько ответов на ваши вопросы о встроенной графике Intel.

Что такое интегрированная графика?

Термин «встроенная» графика означает, что графический процессор встроен в тот же кристалл, что и процессор, и совместно использует доступную системную память. Это означает, что в любой момент времени GPU может получить доступ к от 1 до 5 процентов доступной памяти в зависимости от задач.

Основным преимуществом встроенной графики является доступность, поскольку ноутбуки с дискретной графикой могут стоить на сотни дороже.Комбинированная рабочая нагрузка также означает меньшую теплоотдачу и меньшее потребление энергии, что может привести к увеличению срока службы батареи. Чтобы увеличить время автономной работы, большинство ноутбуков с дискретной графикой на борту переключаются на встроенные чипы, когда не выполняются ресурсоемкие задачи.

Какой графический процессор Intel у меня есть?

Тип графического процессора Intel, который вы получаете, зависит от того, какой у вас ЦП. Ниже мы перечислили некоторые из наиболее распространенных графических процессоров и их процессоров. Кроме того, если у вас есть доступ к компьютеру, который вы хотите проверить, вы можете найти название модели Intel HD Graphics в диспетчере устройств Windows под заголовком «Видеоадаптеры».

INTEL GPU модель CPU (ы)
Intel HD Graphics 610 Pentium 4415U, Celeron 3965U, Celeron 3865U,
Intel HD графика 615 Pentium 4410y, Core i7-7Y75, Core i5-7Y54, Core i5-7Y757, Core m3-7Y30
Intel HD Graphics 620 Core i7-7600U, Core i7-7500U, Core i5-7300U, Core i5-7200U, Core i3 -7100U
Intel HD Graphics 630 Core i7-7920HQ, Core i7-7820HQ, Core i7-7820HK, Core i7-7700HQ, Core i5-7300HQ, Core i5-7440HQ, Core i3-71052H 900 Intel Iris Plus Graphics 640 Intel Core i7-7660U, Core i5-7360U, Core i5-7260U
Intel Iris Plus Graphics 650 Core i5-7287U, Core i5-7267U 0 HD Graphics Celeron N3350, Celeron N3450
Intel HD Graphics 510 9004 2 Pentium 4405U, Celeron 3955U, Celeron 3855U
Intel HD Graphics 515 Pentium N4200, Core M7, -6y75, Core M5-6y57, Core M5-6Y54, Core M3-6Y30
Intel HD графика 520 Core i7-6600U, Core i7-6500U, Core i5-6300U, Core i5-6200U, Core i3-6100U, Core i3-6006U
Intel HD Graphics 530 Core i7-6920H 6820HQ, Core i7-6820HK, Core i7-6700HQ, Core i5-6440HQ, Core i5-6300HQ, Core i3-6100H
Intel Iris Graphics 540 Core i7-6660U, Core i7-6Ure i6650U, , Core i5-6260U, CORE I5-6260U
INTEL IRIS Graphics 550 CORE I7-6567U, CORE I3-6157U, CORE I3-6167U
Intel Iris Pro Ricapt 580 Core I7-6970HQ, Core i7-6870HQ, Core i7-6770HQ, Core i5-6350HQ

В чем разница между Intel HD Graphics и Iris Plus?

Intel HD Graphics — более распространенная версия интегрированной графики для мобильных устройств.Вы найдете ту или иную версию чипа в большинстве ноутбуков, даже в тех, которые оснащены дискретной графикой. Графические чипы HD Graphics не предназначены для сложных задач, таких как AutoCAD, или игр, таких как Doom, For Honor или Rise of the Tomb Raider. Однако они могут надежно транслировать видео и играть в определенные игры, включая популярную Overwatch.

Графические процессоры Intel Iris, которые продаются как Iris Plus (текущее поколение), Iris Pro (последнее поколение) или просто Iris (последнее поколение), обещают значительно более высокую производительность, чем обычная Intel HD Graphics.С Iris вы сможете играть в некоторые игры, однако они по-прежнему не быстрее, чем обычные дискретные графические чипы. В отличие от графических процессоров Intel HD Graphics, Iris имеет небольшой объем встроенной памяти, что помогает ускорить их работу.

ДОПОЛНИТЕЛЬНО: Какой графический процессор вам подходит

Сколько видеопамяти (VRAM) имеют встроенные графические процессоры Intel?

Встроенная графика не имеет где-то изолированного банка памяти. Вместо этого они используют ту же системную память, что и процессор. Таким образом, если у вашего ноутбука 8 ГБ ОЗУ, чип Intel HD Graphics займет часть этой емкости, часто всего 64 или 128 МБ, для себя.Однако чипы Intel Iris имеют небольшой объем встроенной памяти eDRAM, 64 или 128 МБ, что повышает производительность.

Драйвер GPU работает в тандеме с операционной системой, обеспечивая оптимальное распределение памяти между GPU и CPU. Фактический предел варьируется и определяется конфигурацией ОС и компьютера.

Могу ли я выводить изображение на монитор 4K с графикой Intel HD Graphics?

Если у вас есть ноутбук с процессором Intel Core Series 3-го поколения или новее, его графический чип Intel HD может выводить изображение на монитор 4K или внутренний дисплей 4K.Учитывая, что процессоры 3-го поколения вышли в 2012 году, любой современный ноутбук с процессором Core i3, Core i5 или Core i7 может поднять разрешение до 4096 x 2304, что на самом деле немного выше, чем 4K (3840 x 2160). Однако ноутбуки с процессорами Pentium, Celeron и Atom не могут.

Сколько мониторов я могу использовать с графикой Intel?

Ответ во многом зависит от типа выходного порта вашего ноутбука. Если у вас есть любой современный ноутбук с портом mini DisplayPort или портом USB Type-C / Thunderbolt 3, вы можете подключить до трех мониторов с разрешением 1080p каждый, два монитора с разрешением 2K или один монитор с разрешением 4K.Однако, если у вас есть только порт HDMI или VGA, вы не сможете подключить через него два дисплея.

Даже если у вас нет подходящих портов или процессора, вы можете подключить три или более мониторов с помощью док-станции USB, поддерживающей технологию DisplayPort. Эти док-станции используют ваш процессор и собственные микросхемы для отправки видео в виде USB-сигнала.

Могу ли я играть в игры с Intel HD Graphics?

В зависимости от того, насколько требовательна игра, вы сможете играть в нее на средних или низких настройках с разрешением 1080p или, возможно, с более низким разрешением.Когда мы запустили сеанс Overwatch на Dell XPS 13 с Intel HD Graphics 620, мы смогли играть со средними настройками в разрешении 1080p, поскольку система колебалась между 54 кадрами в секунду и 26 кадрами в секунду. На высоких настройках мы не смогли достичь 30 кадров в секунду, минимального минимума для приличного опыта. Однако тот же XPS 13 показал лишь посредственные 28 кадров в секунду в Dirt 3. 

Насколько быстро работает каждая интегрированная видеокарта Intel?

Вот таблица последних графических процессоров Intel HD и Iris и их пиковых частот.Фактическая максимальная частота немного варьируется в зависимости от того, с каким процессором они поставляются.

Intel GPU модель Максимальная частота Max EDRAM
Intel HD графика 610 350 MHZ 0,95 ГГц
Intel HD графика 615 300 МГц 1,05 ГГц
Intel HD Graphics 620 300 МГц 1.05 GHZ
Intel HD Graphics 630 300 MHZ
Intel Iris Plus Графика 640 300 МГц 1,05 ГГц 64 МБ
Intel Iris Plus Graphics 650 300 MHZ 1,10 ГГц 64 МБ 64 МБ
INTEL HD Graphics 500 200 МГц 700 МГц
Intel HD графика 510 350 МГц 1.05 GHZ
Intel HD Graphics 515 300 MHZ 1,00 GHZ
300 МГц 1,05 GHZ
Intel HD графика 530 300 МГц 1.15 ГГц
INTEL Iris Graphics 540 300 МГц 1,05 ГГц 1,05 ГГц 64 МБ 64 МБ
Intel Iris Graphics 550 300 МГц 1.10 ГГц 64 МБ
Intel Iris Pro Graphics 580 300 МГц 1,15 ГГц 128 МБ
2

Фото: Intel

Руководство по обновлению ноутбука

Производительность графического процессора — Обзор Apple iPad Pro 2018 (11 дюймов): удвоение производительности

Производительность графического процессора

Пользовательский графический процессор Apple в iPad Pro такой же, как и в iPhone, но с большим количеством доступных ядер.А с большей площадью поверхности iPad по сравнению с телефоном, вероятно, и более высокая частота. В настоящее время имеется семь ядер графического процессора A12 по сравнению с четырьмя на iPhone, и Apple утверждает, что графический процессор в iPad Pro эквивалентен Xbox One S, хотя трудно сказать, как они пришли к такому выводу, поскольку мы знаем так мало. об основах GPU.

Грубо говоря, производительность Xbox One S составляет примерно 1,4 TFLOPS на пике производительности. Но, к лучшему или к худшему, когда ПК перешли на унифицированные шейдеры, индустрия перешла на FP32 для всех функций GPU.В отличие от мобильного мира, где мощность является абсолютным фактором для всего, вершинные шейдеры обычно имеют скорость 32 бита на канал, а пиксельные и вычислительные шейдеры часто могут иметь скорость 16 бит на канал. Мы видели некоторые движения на стороне ПК, чтобы использовать графические процессоры половинной точности для вычислений, но для игр в настоящее время это не так.

В целом, это затрудняет сравнение сопоставимых ПК. SoC AMD Ryzen 2700U имеет графический процессор Vega, который теоретически обеспечивает производительность 1,66 TFLOPS при FP32. Теоретически, если работать с 16-битной системой, это число удвоится.iPad Pro, вероятно, будет использовать половинную точность для некоторых рабочих нагрузок графического процессора. Это было проблемой в течение многих лет и затрудняло легкое сравнение любого кроссплатформенного теста с ПК.

Как и в случае с iPhone, пиковая производительность графического процессора Apple, даже в iPad, по-прежнему значительно выше, чем устойчивая производительность. Пожалуйста, ознакомьтесь с нашим обзором iPhone XS, чтобы Андрей подробно рассказал об этом, но благодаря транзакционным рабочим нагрузкам вычислений на GPU в iOS высокая пиковая производительность является преимуществом, даже если она не может поддерживаться с течением времени.

3DMark Sling Shot 3.1 Extreme Unlimited

Вот наш первый взгляд на GPU в iPad Pro по сравнению с мобильными конкурентами. Несмотря на то, что ядер графического процессора всего на 75% больше, чем у iPhone XS Max, iPad Pro показывает результат на 164% выше в графическом результате, что будет зависеть от тактовой частоты графического процессора и увеличенной пропускной способности памяти. Это далеко впереди всего остального в мобильном мире.

В физике, которая больше похожа на тест процессора, iPad Pro по-прежнему имеет самый высокий результат, но отставание от конкурентов намного меньше.

Также следует отметить, что этот тест крайне ненадежен на iPad, в большинстве случаев происходит сбой.

3DMark Ice Storm без ограничений

Вот первый тест, который мы можем использовать для сравнения с ПК, но в отличие от Sling Shot, который использует Metal на iOS, этот тест основан на OpenGL ES 2.0. В Windows он использует DX11, и, конечно же, точность на мобильных устройствах и ПК не одинакова, поскольку версия для ПК работает на 32-разрядной версии и OpenGL ES 2.0 только с использованием 16-бит.

В целом, iPad Pro значительно опережает любой из ПК в этом тесте, хотя тест физики показывает, что новейшие процессоры Intel по-прежнему имеют преимущество над iPad в этом тесте. Однако с точки зрения графики iPad Pro набирает вдвое больше очков, чем AMD Ryzen 7 2700U с Vega, и неудивительно, что графический процессор Intel UHD 620 занимает последнее место.

GFXBench

Последним тестом GFXBench является Aztec Ruins, который предлагает как обычный режим с разрешением 1920×1080, так и высокий режим с разрешением 2560×1440.Это немного сложнее, чем их старые тесты, и Kishonti создал тест во всех современных API: Vulkan, Metal и OpenGL ES 3.2 для мобильных устройств, а для настольных компьютеров он доступен в OpenGL, DX11 и DX12. . Для наших целей мы проигнорируем OpenGL для настольных ПК, так как на данный момент он уже выходит из употребления.

Пиковая производительность iPad Pro намного выше, чем у любого из протестированных нами 15-ваттных ноутбуков. Сейчас мы не уверены, использует ли версия Metal шейдеры половинной точности, но старые тесты Kishonti использовали их, так что, вероятно, они тоже есть.Разрыв по сравнению с iPhone невелик, хотя и при нормальных настройках, что указывает на то, что тест становится узким местом ЦП при низких разрешениях. Высокие настройки показывают увеличение производительности iPad на 80% по сравнению с iPhone XS.

Устойчивые результаты

Как упоминалось выше, Apple предлагает значительно более высокую пиковую производительность графического процессора, чем устойчивую, что может быть полезно для вычислительного графического процессора в ОС для различных функций. Но для игр важна стабильная производительность.

GFXBench предлагает режим разрядки батареи, в котором Manhattan 3.1 зацикливается последовательно. Для сравнения, если вы запустите Manhattan 3.1 на iPad, результат составит 100,79 кадров в секунду за один запуск, что составляет 6249 кадров.

Более продолжительный тест начинается с высокого уровня, но затем производительность значительно снижается в первых двух запусках, а затем начинает снижаться ближе к концу. Самая низкая частота кадров в этом примерно 30-минутном тесте составляет 3960,9 кадров, что составляет 63.9 кадров в секунду. Это примерно на 36% снижение производительности с течением времени.

Результаты игр

Вся эта синтетика имеет место быть, но настоящие игры — это то, для чего людям нужна дополнительная производительность. Когда Apple заявляет, что iPad Pro оснащен графическим процессором класса Xbox One S, это имеется в виду в играх, потому что вы не используете Xbox One S для выполнения транзакционных вычислительных рабочих нагрузок.

Тем не менее, все вышеперечисленные предостережения применимы, и это усугубляется тем, что практически нет кроссплатформенных игр, доступных как для ПК, так и для iPad.Единственным исключением из этого правила является Civilization VI, которая теперь предлагает практически полный порт ПК-версии на iPad.

На iPad Civilization VI настроен на использование Metal, в отличие от DX11 или DX12 на ПК. Однако в качестве приложения для iPad в iOS гораздо меньше параметров конфигурации, но с помощью правильных инструментов вы можете получить доступ к текстовому файлу конфигурации и внести несколько изменений.

По умолчанию игра на iOS работает только с разрешением 1112 x 834 — разрешением без сетчатки в последнем поколении 10.5-дюймовый iPad Pro — и нет возможности настраивать графику через пользовательский интерфейс, как в версии игры для ПК. Вы можете отредактировать файл конфигурации, чтобы разблокировать Retina-версию этого разрешения, что удваивает эффективное разрешение до 2224×1668. Кроме того, поскольку игра является портом версии для ПК, вы также можете получить доступ к меню отладки, чтобы посмотреть время кадра.

Мы загрузили один и тот же файл сохранения игры на все устройства и один и тот же файл конфигурации на несколько устройств с разрешением игры в пределах 1% от iPad, а затем проверили время кадра для каждого:

При стандартных настройках на iPad у графического процессора не было проблем с ограничением частоты кадров до максимума 27 кадров в секунду.

Удвоение разрешения Civilization VI буквально не повлияло на производительность. iPad Pro может работать с разрешением 2224×1668, легко ограничивая частоту кадров теми же 27 кадрами в секунду, что и в версии игры без Retina.

Intel UHD 620 в паре с Core i5 в Surface Pro 6 не имеет ограничений по частоте кадров, но привязан к графическому процессору со скоростью чуть более 21 кадра в секунду.

GeForce MX150 в Huawei MateBook X Pro — это версия MX150 с более низким TDP, ограниченная частотой около 1038 МГц.Он способен стабильно достигать 45 кадров в секунду.


Наше последнее устройство оснащено процессором AMD Ryzen 7 2700U с 10 вычислительными блоками Vega и 15-ваттным TDP. Он предлагает самую высокую производительность при этих настройках со средним значением почти 50 кадров в секунду.

Результаты Civilization VI — это вкратце все впечатления от iPad Pro. SoC A12X имеет достаточную производительность, но ограничения реализации этой игры на iOS ограничивают возможности пользователя. С блокировкой кадров примерно 27 кадров в секунду у iPad Pro нет никаких проблем с максимальным значением в любое время, а преимущество ограничителя частоты кадров заключается в том, что количество требуемой энергии намного ниже, и, следовательно, время автономной работы. это лучше.Но, в отличие от ПК, обойти это ограничение невозможно. Civilization VI — это не та игра, в которую можно играть с очень высокой частотой кадров, но пользователь редко решает, что он может делать на iOS. Игра была явно перенесена для обеспечения стабильной производительности на более ранних моделях iPad, и когда Apple отказывается от гораздо более быстрого графического процессора в iPad, нет возможности настроить производительность, чтобы воспользоваться ею.

Вывод графического процессора

Итак, является ли iPad Pro графическим процессором класса Xbox One S? Вероятно, это так.Xbox One S лишь немного быстрее, чем оригинальный Xbox One, выпущенный в 2013 году, и этой консоли будет сложно достичь 1080p в играх того времени. Vega iGPU в Ryzen 7 2700U предлагает больше теоретических FLOPS, чем Xbox One S, хотя и с более высоким TDP на 15 Вт по сравнению с iPad Pro. В синтетических тестах iPad Pro набрал больше очков, чем графический процессор Vega, хотя и с меньшей точностью, но, несмотря на это, нет никаких сомнений в том, что графический процессор в iPad Pro достаточно мощный. Добавьте к этому эффективность и более низкий TDP, и результаты станут еще сильнее.При стабильной производительности iPad потреблял в среднем чуть менее 8 Вт для всего устройства.

Обзор

Metal — Apple Developer

Что нового

Улучшенная интеграция графики и вычислений

Чтобы лучше реализовать новейшие методы рендеринга на GPU, теперь вы можете вызывать динамические библиотеки, использовать указатели на функции и использовать API трассировки лучей непосредственно из графических шейдеров.

Функция сшивания

Эффективно объединяйте предварительно скомпилированные функции в более сложные функции во время выполнения.Это позволяет инструментам разработки шейдеров предварительно компилировать отдельные узлы шейдеров, сохраняя при этом гибкость при создании шейдеров.

Новые функции трассировки лучей

API трассировки лучей теперь поддерживает размытие в движении, идентификаторы пользовательских экземпляров и расширенные числовые пределы, чтобы помочь вам создавать очень сложные сцены с профессиональным рендерингом.

Обучение машинному обучению с ускорением на GPU

MPSGraph добавляет новые операции и оптимизации с использованием примитивов машинного обучения на основе металлического буфера на графическом процессоре, поэтому вы можете ускорить обучение модели машинного обучения на Mac с более высокой пиковой производительностью.

Плагин Metal

для TensorFlow

В

Metal добавлена ​​поддержка интерфейса PluggableDevice для TensorFlow, поэтому вы можете начать обучение с высокой производительностью на macOS Monterey.

Начало работы

Отладчик состояния производительности графического процессора

Оптимизируйте свой графический код для увеличения мощности и производительности на всех платформах Apple.

Просмотр временной шкалы Metal Debugger

Чтобы помочь достичь максимальной производительности с помощью новейших методов рендеринга, Metal Debugger теперь включает счетчики производительности и инструменты анализа узких мест, обеспечивая единое представление команд Metal, ресурсов и буферов на временной шкале событий GPU.

Выборочный отладчик шейдеров

Чтобы значительно сократить время, необходимое для отладки невероятно большого кода шейдера графического процессора, Xcode 13 теперь включает возможность нацеливания и отладки определенных функций в общем коде шейдера графического процессора.

Средство очистки адреса графического процессора

Xcode 13 может автоматически находить сложные ошибки, такие как переполнение буфера, в сложном коде шейдера графического процессора.

Инструмент преобразования текстур

Чтобы упростить оптимизацию ресурсов игровых текстур для платформ Apple, новый инструмент преобразования текстур поддерживает новейшие современные форматы текстур, используемые в играх высокого класса.Для разработчиков игр со средой сборки на базе Windows инструмент преобразования текстур также доступен в пакете Metal Tools for Windows.

Аппаратное обеспечение

для глубокого обучения. Часть 3: GPU | Григорий Сапунов

GPU

, Graphics Processing Units — специализированные процессоры, изначально созданные для задач компьютерной графики. Современные графические процессоры содержат множество простых процессоров (ядер) и обладают высокой степенью параллелизма, что делает их очень эффективными при выполнении некоторых алгоритмов. Умножение матриц, являющееся сейчас ядром DL, входит в их число.

Самые современные системы DL представляют собой сочетание ЦП и ГП, где ГП выполняет тяжелую работу, а ЦП отвечает за загрузку данных в/из памяти графической карты и организацию вычислений.

Обучение — это гораздо более интенсивный процесс вычислений, чем вывод, и графические процессоры особенно важны для режима обучения. Для логического вывода они тоже хороши, но здесь могут играть роль другие факторы (такие как размер, энергопотребление, цена и т. д.) в зависимости от целевой системы, для которой вы разрабатываете нейронную сеть (НС).

Среди графических процессоров NVIDIA и вне конкуренции, потому что почти каждый DL-фреймворк поддерживает графические процессоры NVIDIA, но не поддерживает графические процессоры AMD. Так что AMD чуть не проиграла эту битву. Есть некоторые действия, и я вернусь к AMD в конце поста.

Давайте обсудим важные аспекты графических процессоров.

Производительность графического процессора продолжает расти. Если вы нарисуете диаграмму с пиковой производительностью в GFLOPS, она будет выглядеть так (добавлены некоторые справочные точки, не связанные с GPU):

Важно: Это FP32, число с плавающей запятой одинарной точности, производительность.Это не единственный вариант измерения, скоро вы узнаете о FP16/FP64/INT8. Таким образом, вы можете увидеть другие диаграммы с большими числами. Но в любом случае, FP32 — это хорошая точка соприкосновения, потому что вы увидите, что есть много предостережений с другими.

Важно: Пиковая производительность может быть очень далека от производительности на реальных задачах. Правильнее сказать, реальная производительность может сильно отставать от пиковой производительности (и вы увидите это ниже). Это связано с тем, что для достижения максимальной производительности вам необходимо сильно оптимизировать свои вычисления, поддерживая оптимальную загрузку всех частей конвейера обработки, избегая узких мест и так далее.Может быть, это достижимо, но я не видел ни одного разработчика DL, который хотел бы тратить время на такие хардкорные оптимизации вместо того, чтобы работать с самими нейронными сетями. Более того, это требует совершенно другого набора навыков и знаний, а также низкого уровня понимания архитектуры графического процессора (или нескольких архитектур). Итак, здесь есть ниша для специального программного обеспечения для оптимизации вычислений, связанных с DL, и NVIDIA TensorRT является одним из примеров такого класса программного обеспечения, специально предназначенного для логических выводов (но я думаю, что обычно оно работает на более высоких уровнях, чем я описал). , другие могут быть реализованы в фреймворках DL (например, у нас есть параметры оптимизации в компиляторах) и специальных библиотеках.Может быть, даже когда-нибудь у нас будет специальный ИИ для решения этих проблем оптимизации (как это сделал Google в своих статьях ). Но в любом случае пиковая производительность — это показатель реальной производительности, поэтому относитесь к ней с умом. Скоро вы увидите примеры реальной производительности по сравнению с пиковой производительностью.

Вы можете найти таблицы с данными и сравнениями в моем Google Doc здесь.

Для сравнения, новый 18-ядерный процессор Intel Core i9 Extreme Edition (i9–7980XE) с TDP 160 Вт и рекомендованной ценой 1999 долларов США называют чипом для потребительских ПК с первой терафлопсной скоростью (но я не уверен, какие именно TFLOPS упоминается, я полагаю, FP64).Половина цены GTX 1080 Ti обеспечивает в 10 раз больше TFLOPS. Вот более популярная версия с небольшой историей.

Вычисление FLOPS для современных процессоров затруднено из-за таких возможностей, как векторизация, плавное умножение-сложение, гиперпоточность, режим «турбо» и так далее. Можем сделать приблизительную оценку. Intel Haswell/Broadwell/Skylake выполняет 32 SP FLOP/цикл, Skylake-X выполняет 64 SP FLOP/цикл (спасибо AVX-512, более подробную информацию об AVX-512 см. в посте о ЦП серии).

Итак, для одного 18-ядерного 7980XE (Skylake-X), работающего на базовой частоте 2.60 ГГц (в режиме Turbo может быть до 4,20 ГГц) Пиковая производительность в GFLOPS составляет 18 * 2,6 * 64 = 2995, то есть около 3 TFLOPS FP32. Это в 3 раза больше, чем «скорость терафлопс». Может быть, это потому, что поведение частоты сложное, особенно в случае режимов AVX. Базовая частота применима только к рабочим нагрузкам, отличным от AVX. Для тяжелых рабочих нагрузок в AVX-512 процессор снижает тактовую частоту. Если бы в статье упоминалась производительность FP64, а базовая частота AVX ниже 2,60 ГГц, то 1 TFLOPS FP64 можно было бы понять.

Для 6-ядерного i7-6850K (Broadwell) без AVX, работающего на базовой частоте 3,60 ГГц, оценка составляет 6*3,6*32 = 690 GFLOPS FP32.

Поправьте меня, если я где-то ошибся, пожалуйста.

Кстати, если вы знаете надежный источник показателей пиковой/реальной производительности Intel/AMD (в FLOPS, а не в специальных баллах), дайте мне знать. Похоже, Intel не любит участвовать в этих сравнениях.

FP32, FP16, INT8, INT4, Mixed-Precision

Существует тенденция к использованию FP16 (половинной точности) вместо FP32 (одинарной точности), поскольку вычисления с более низкой точностью кажутся некритичными для нейронных сетей.Это также делает двойную точность (FP64) бесполезной, потому что дополнительная точность ничего не дает, хотя и медленнее.

Существует режим обучения смешанной точности, в котором используются представления одинарной и половинной точности. NVIDIA расширила набор инструментов, доступных для вычислений со смешанной точностью, начиная с архитектуры Pascal и CUDA 8. Intel тоже нравится эта тема, см. технический документ от 19 января 2018 года под названием « Low Numerical Precision Deep Learning Inference and Training ».

«Хранение данных FP16 (половина точности) по сравнению с FP32 или FP64 более высокой точности , чем передачи FP32 или FP64.Более того, для многих сетей вывод на основе глубокого обучения может выполняться с использованием 8-битных целочисленных вычислений (INT8) без существенного влияния на точность». [источник]

Помимо возможности обучать и хранить более крупные модели, переход на FP16 обычно дает двукратное увеличение скорости (в 2 раза больше TFLOPS).

FP16 изначально поддерживается, начиная с архитектуры Tegra X1 и Pascal.

«До этих частей любое использование данных FP16 требовало их повышения до FP32 как для вычислительных целей, так и для целей хранения, а это означало, что использование FP16 не предлагало какого-либо существенного улучшения производительности или потребностей в хранении.На практике это означало, что если разработчику нужна была только точность, обеспечиваемая вычислениями FP16 (и глубокое обучение быстро становится здесь примером из учебника), то на архитектурном уровне мощность тратилась впустую на вычисление этой дополнительной точности». [источник]

Но есть оговорки. NVIDIA сильно ограничила производительность CUDA FP16 и FP64 на игровых картах (включая 1080 Ti, Titan X/Xp). Производительность FP16 составляет 1/64, а FP64 — 1/32 производительности FP32.

(Сен 2018 г.) Ситуация теперь изменилась с помощью Turging Architecty и новой серии RTX Gaming Cards ( RTX 2070660/ / 2080 / 2080 Ти ). Чипы Тьюринга поддерживают неограниченные вычисления FP16.

Подробнее о сравнении Tesla и Geforce.

AMD Radeon RX Vega не имеет ограничений для FP16, обеспечивая двукратную производительность по сравнению с FP32, а FP64 медленнее (1/16).

INT8 полезен для ускорения вывода . INT8 приводит к t̶h̶e̶ ̶g̶o̶o̶d̶ ̶o̶l̶d̶ ̶8̶-̶b̶i̶t̶ ̶w̶o̶r̶l̶d̶ ̶w̶o̶r̶l̶d̶ значительно более узкому динамическому диапазону и меньшей точности, и может быть проблемой полностью перейти на целочисленную арифметику для нейронных сетей, но преобразование существующих сетей (первоначально обученных с использованием FP32) работает.Вот некоторые размышления об этом. Насколько я понимаю, хороших кейсов по использованию INT8 для для обучения на GPU нет.

INT8 требует sm_61+ (Pascal TitanX, GTX 1080, Tesla P4, P40 и другие). Вы можете найти поддерживаемые вычислительные возможности для всех чипов NVIDIA здесь.

INT1 как вариант сейчас не существует, но есть много работ по бинаризации нейронных сетей (замена вещественных весов бинарными соединениями 0/1): « Бинаризованные нейронные сети: обучение глубоких нейронных сетей с весами и Активации ограничены +1 или -1 », « XNOR-Net: классификация ImageNet с использованием бинарных сверточных нейронных сетей » и XNOR.ИИ», Как обучить компактную бинарную нейронную сеть с высокой точностью? », « FINN: платформа для быстрого, масштабируемого двоичного вывода нейронных сетей » и так далее. Вот краткий обзор и дополнительные ссылки на бинарное глубокое обучение. Это приводит к еще более радикальному сокращению требований к памяти, а также к ускорению вычислений. Такие расчеты особенно хорошо подходят для FPGA, но могут понравиться и процессорам и другим вариантам. Я не удивлюсь, если NVIDIA или Intel однажды заговорят об этом. (обновление за сентябрь 2018 г.: они сделали это. См. ниже)

И FP16, и INT8 экономят память и могут дать значительное ускорение по сравнению с FP32 (имейте в виду, что TensorRT, упомянутый на картинке, также делает много других оптимизаций):

От Криса Готтбрата, Nvidia slides

(сентябрь 2018 г.) Nvidia недавно выпустила ускоритель логических выводов TESLA T4 с поддержкой INT4 , который в два раза быстрее, чем INT8. И есть некоторые разговоры о INT1: «У нас есть несколько исследователей, которые опубликовали работу, в которой даже с четырьмя битами они могут поддерживать высокую точность с очень маленькими, эффективными и быстрыми моделями.Вы могли бы даже перейти на INT1, но это довольно продвинутый материал и все еще тема для исследований».

Производительность TESLA T4 на FP16/INT8/INT4

INT4 поддерживается всеми чипами архитектуры Turing.

Вот сводная таблица ускорений/замедлений FP16/INT8/INT4/FP64 для многих популярных графических процессоров:

Производительность FP16/FP64/INT8/INT4 по сравнению с FP32

Сообщите мне, если вы обнаружите здесь ошибки, или оставьте комментарий в исходный файл.

Зная это, мы можем составить таблицу для сравнения FP16 (здесь я оставил в основном последние графические процессоры).Игровые карты RTX выглядят очень интересно.

И та же диаграмма для INT8 (TOPS вместо GFLOPS, потому что теперь мы считаем операции с целыми числами, а не с плавающей запятой).

Числа для карт 2017 года и старше рассчитываются на основе их производительности FP32, а числа для карт 2018 года взяты из документации NVIDIA, и, кажется, они рассчитывают производительность INT8 на основе Tensor Core FP16 (см. следующий раздел). Поэтому, вероятно, на этой диаграмме есть некоторые ошибки, в основном касающиеся Tesla V100/TitanV, которые также имеют тензорные ядра (поэтому их количество должно быть выше).Я скоро это исправлю.

Тензорные ядра

Архитектура NVIDIA Volta имеет дополнительные тензорные ядра и обещает, что она будет обеспечивать около 120 TFLOPS (FP16) для V100 (немного больше для Tesla V100, немного меньше для Titan V). Это огромные цифры, и они высоко над графиком с максимальным значением около 15 TFLOPS (FP32). Будьте осторожны, здесь я переключился на TFLOPS (=1000 GFLOPS) .

(сент 2018 г.) Тьюринг Архитектура и новая серия RTX Gaming Cards 0 ( 0 RTX 2070 1 / 2080 1 1 0/ 2080 Ti ) ​​имеют на борту тензорные ядра.Так, например, RTX 2080 Ti с более чем 100 TFLOPS FP16 выглядит весьма перспективно. Особенно Founders Edition (FE на графике).

Мы можем нарисовать график производительности FP16 для тензорных ядер:

cuDNN поддерживает тензорные ядра, начиная с версии 7. Ядра, использующие Tensor Core Operations, доступны как для CNN, так и для RNN для прямых и обратных вычислений. Подробнее здесь. cuDNN может предпочесть не использовать Tensor Core Operations (например, когда размер задачи не подходит для ускорения Tensor Core) и вместо этого использовать альтернативную реализацию, основанную на обычных операциях с плавающей запятой.Вы должны вручную включить использование операций Tensor Core, установив математический режим на CUDNN_TENSOR_OP_MATH, поскольку по умолчанию в cuDNN используется значение CUDNN_DEFAULT_MATH, и это указывает на то, что операции Tensor Core будут избегаться библиотекой.

NVIDIA заявляет, что «Тензорные ядра уже поддерживаются для обучения глубокому обучению либо в основном выпуске, либо через запросы на вытягивание во многих средах глубокого обучения (включая Tensorflow, PyTorch, MXNet и Caffe2). Дополнительные сведения о включении тензорных ядер при использовании этих платформ см. в руководстве по обучению смешанной точности .Для вывода глубокого обучения недавний выпуск TensorRT 3 также поддерживает тензорные ядра».

Тензорные ядра выглядят круто, а тесты NVIDIA впечатляют:

Сравнение производительности свертки на Tesla V100 (Volta) с тензорными ядрами и Tesla P100 (Pascal). Сравнение проводится между средними геометрическими временами выполнения слоев свертки из каждой нейронной сети. И V100, и P100 используют входные/выходные данные FP16 и вычисления FP32; В V100 используются тензорные ядра, а в P100 — сложение с плавным умножением FP32 (FMA).https://devblogs.nvidia.com/programming-tensor-cores-cuda-9/

Проблема в том, что совершенно непонятно, как приблизиться к пиковой производительности в 120 TFLOPS, и насколько я знаю, никто не мог добиться столь значительной ускорение на реальных задачах. Дайте мне знать, если вы знаете о хороших случаях.

  • Тест RNN/LSTM достиг ускорения только до х2 по сравнению с Tesla V100 и P100.
  • То же ускорение в 2 раза по сравнению с Tesla V100 и P100 на CNN.
  • Бенчмарк CNN, сравнивающий Titan V с Titan Xp, дает ускорение почти в 2 раза (в основном из-за перехода на FP16 с FP32)Это далеко не 120 TFLOPS.
  • Другой набор задач компьютерного зрения показывает аналогичную картину с чуть лучшей производительностью V100 FP32 по сравнению с 1080 Ti, а большая часть прироста (около 2х) получена от перехода на FP16 (что вполне понятно). Было бы интересно протестировать здесь P100 FP16.

Ускорение 2x — это круто, но не так круто, как теоретическое 12x Разница между пиковой производительностью P100 и V100.

(апрель 2019 г.) Благодаря тензорным ядрам и смешанным вычислениям FP32/16 у нас появилось еще одно интересное различие между игровыми и профессиональными картами.Существует два типа тензорных операций FP16: FP16 с накоплением FP16 и FP16 с накоплением FP32 (что дает вам большую точность). А GeForce FP16 w FP32 acc с ограничением пропускной способности на половинной скорости !

Итак, пока вы получите 130 Tflops на Titan RTX

и около 108 Tflops на 0 2080 Ti с FP16 W FP16 ACC, номера для 2080 Ti

60 Drop наполовину с FP16 W FP32 ACC (так что имея около 54 TFLOPS на 2080 Ti во время пребывания на 0 Titan RTX ).

Есть две важные проблемы, связанные с памятью: объем памяти и пропускная способность памяти.

Объем памяти

Вот простое правило, чем больше, тем лучше.

Думаю, 11–12 Гб на современных топовых игровых картах — это сейчас стандарт. Существует много моделей NN, которые не вмещаются в 6Gb памяти, и вы вдруг обнаружите, что и 8Gb недостаточно. Если вам нравится играть в NN, такие как Lego (а они на самом деле своего рода Lego), то вы обнаружите, что комбинируете разные модели, и для этого вам нужна память.

Многие TESLA имеют 16 Гб, а также новые модели Quadro с архитектурой Turing (RTX 6000, RTX 8000) с 24 и 48 Гб GDDR6 соответственно. Quadro GV100 (Volta) имеет 32 Gb HBM2.

Titan RTX

(апрель 2019 г.) Titan RTX , анонсированный в декабре 2018 г., имеет потрясающие 24 Гб (с возможностью объединения двух карт по NVLink). Это было довольно неожиданно по сравнению с предыдущими Титанами. Это дает вам гораздо больше свободы для экспериментов с более крупными сетями или обучения с большими партиями (что экономит ваше время).

Есть некоторые хитрости вроде уменьшения размера партии, преобразования моделей в FP16 и даже INT8 (в случае логического вывода), обрезки, бинаризации и так далее (подробнее о подходах к экономии памяти). Некоторые из них легко реализовать (или они уже поддерживаются выбранным вами фреймворком), некоторые нет. В любом случае, вы хотели бы иметь больше памяти.

Пропускная способность памяти

Сложность здесь в том, что некоторые вычисления, связанные с NN, ограничены полосой пропускания, а не вычислениями ! В основном это означает, что ваш крутой горячий графический процессор работает значительно ниже своей пиковой производительности, и либо вы могли бы достичь тех же результатов с более дешевым оборудованием, либо вы могли бы сделать его более эффективным с другим оборудованием (не обязательно с большей производительностью, но с большей пропускной способностью). ).

Вот пост Eugenio Culurciello et al. о вычислениях и пропускной способности памяти.

В документе говорится, что в некоторых наихудших условиях эффективность графического процессора находится в диапазоне 15–20% от пиковой теоретической производительности! Итак, ваша новенькая Tesla V100 превращается в GTX 1050 Ti — GTX 1060.

В таких непростых случаях полезно посмотреть на пропускную способность. Например, GTX Titan Xp (10790 FP32 GFLOPS, пропускная способность 547 ГБ/с) может быть быстрее, чем GTX 1080 Ti (10609 FP32 GFLOPS, 484 ГБ/с) на 13 % в таких задачах с ограниченной пропускной способностью.А GTX Titan V с 652,8 ГБ/с выглядит еще лучше. Tesla V100 имеет 900 ГБ/с, P100 — 720 ГБ/с.

(908) RTX 2080 Ti

0 имеет 616 ГБ / с (+ 27% по сравнению с 1080 TI), RTX 2080 имеет 448 ГБ / с.

(апрель 2019 г.) Titan RTX имеет 672 ГБ/с.

Из статьи «Оптимизация эффективности памяти для глубоких сверточных нейронных сетей на графических процессорах»:

« Сверточные слои обычно занимают больше всего времени во всей сети.Поэтому достижение высокой арифметической производительности было главной целью оптимизации. … Вопреки здравому смыслу, мы видим, что сверточные слои не обязательно привязаны только к вычислениям . В частности, для сверточных слоев с небольшими размерами C и N производительность фактически ограничена памятью, как и для 2D-свертки.

Слои пула обычно сочетаются со сверточными слоями в CNN. По сравнению со сверточными слоями, объединяющие слои имеют низкую арифметическую сложность, O(N*C*H*W).Его производительность в основном ограничена эффективностью памяти (т. е. пропускной способностью и задержкой)

Каждый шаг слоя softmax включает матрично-векторные вычисления . Низкая арифметическая интенсивность в этих матрично-векторных операциях и промежуточная передача данных на разных этапах также делают их привязанными к памяти ».

В типичных реализациях RNN матрица рекуррентных весов должна перезагружаться из памяти на каждом временном шаге, что делает расчеты RNN ограниченной полосой пропускания.Из-за присущей им последовательности трудно заставить RNN использовать все ресурсы GPU.

Существуют некоторые решения (например, Persistent RNN), позволяющие сделать проблему, связанную с пропускной способностью, проблемой, связанной с вычислениями. Согласно статье Persistent RNN:

«Пиковая производительность Titan X с плавающей запятой составляет 6,144 TFLOP/с. Простая реализация RNN с использованием операций GEMM достигает скорости 0,099 TFLOP/с при размере слоя 1152 с использованием ядер Nervana Systems GEMM при размере мини-пакета 4.Наша первоначальная реализация Persistent RNN с тем же уровнем и размером мини-пакета достигает более 2,8 TFLOP/с, что дает 30-кратное ускорение».

Существует множество других способов не использовать весь потенциал вашего графического процессора и замедлить работу вашей нейронной сети, начиная с неправильных размеров пакетов и заканчивая более сложными проблемами. Из предыдущей статьи об оптимизации эффективности памяти:

» Более того, даже для слоев, которые всегда считались связанными с вычислениями, т.е.например, сверточные слои, мы обнаружили, что выбор подходящего макета данных может привести к повышению производительности в 2,3 раза». Беркли, который дает лучшее представление о фактической производительности вычислений:

Источник: http://cadlab.cs.ucla.edu/~cong/slides/HALO15_keynote.pdf

Вот один из примеров теста NN из статьи о Google TPU (подробнее об этом в следующих частях), выполненный на графическом процессоре K80:

Вы видите, что большинство NN работают ниже пиковой производительности, иногда значительно ниже.И некоторые из них на самом деле находятся в области, ограниченной ограничениями пропускной способности. Итак, имейте это в виду. Подробнее о линии крыши.

Вот недавний доклад группы продуктов Intel AI на CogX 2018, в котором упоминается модель Roofline с примерами, подчеркивающими, что правильная оптимизация коммуникаций может значительно повысить производительность (например, в 50 раз).

Существует тенденция к использованию конфигураций одной системы с несколькими графическими процессорами и даже распределенных конфигураций с несколькими системами с несколькими графическими процессорами. Частично решает проблемы с ограниченной производительностью и памятью.

Одна машина, несколько графических процессоров, работающих над отдельными задачами

Во-первых, речь не о SLI, о котором вы могли слышать в старые добрые времена компьютерных игр. SLI — это технология, позволяющая связать 2–4 графических процессора для разделения работы по рендерингу изображения. Речь идет только о рендеринге графики.

В CUDA (то есть о вычислениях, а не о графике) вы можете получить прямой доступ к любому доступному графическому процессору в вашей системе, поэтому просто добавьте несколько графических процессоров и используйте любой из них. Вы можете написать свою программу, которая будет делать все, что вы хотите, загружая данные в любой графический процессор и выполняя вычисления на выбранном графическом процессоре.

Обычно инженеры глубокого обучения не пишут код CUDA, они просто используют фреймворки, которые им нравятся (TensorFlow, PyTorch, Caffe, …). В любой из этих сред вы можете указать системе, какой графический процессор использовать.

Несколько графических процессоров, работающих над общими задачами (с одним или несколькими хостами)

Но выбор конкретного устройства для обучения нейронной сети — это еще не все. Это нормальный способ, если вам нужно обучить несколько моделей одновременно (возможно, пробуя разные параметры, поэтому мы можем назвать этот режим как Hyper-Parameter Parallel ).Что делать, если вы хотите быстрее обучать большие модели?

Таким образом, вам необходимо разделить работу между несколькими графическими процессорами в вашей системе (а также между несколькими системами). Распределенное обучение — это ответ.

Существует два основных подхода к распараллеливанию обучения нейронных сетей: параллелизм моделей и параллелизм данных .

При модельном параллелизме разные машины в распределенной системе отвечают за вычисления в разных частях одной сети — например, каждый слой нейронной сети может быть назначен разным машинам.

При параллелизме данных разные машины имеют полную копию модели; каждая машина просто получает разные порции данных, и результаты каждой из них каким-то образом объединяются.

Из документации SkyMind

Параллелизм данных более популярен, но эти подходы не исключают друг друга. А в некоторых случаях приходится разбивать модели на несколько машин только потому, что модель слишком велика для одной машины. См., например, Google NMT:

Архитектура модели GNMT, системы нейронного машинного перевода Google.Модель разделена на несколько графических процессоров для ускорения обучения. В нашей настройке у нас есть 8 слоев LSTM кодировщика (1 двунаправленный слой и 7 однонаправленных слоев) и 8 слоев декодера. При использовании этого параметра реплика одной модели разделяется на 8 частей и размещается на 8 различных графических процессорах, обычно принадлежащих одному хост-компьютеру. Слой softmax также разбит на разделы и размещен на нескольких графических процессорах. В зависимости от размера выходного словаря мы либо запускаем их на тех же графических процессорах, что и сети кодировщика и декодера, либо запускаем их на отдельном наборе выделенных графических процессоров.

У NVIDIA есть Библиотека коллективных коммуникаций (NCCL), которая реализует примитивы коллективной связи с несколькими GPU и несколькими узлами, производительность которых оптимизирована для графических процессоров NVIDIA. Разработчики сред глубокого обучения и приложений для высокопроизводительных вычислений могут положиться на высокооптимизированные, MPI-совместимые и учитывающие топологию подпрограммы NCCL, чтобы в полной мере использовать все доступные графические процессоры внутри и между несколькими узлами.

NCCL 1.x была ограничена внутриузловой, NCCL 2.x поддерживает многоузловые конфигурации:

У Intel есть аналогичная библиотека под названием Machine Learning Scaling Library (MLSL), у AMD есть ROCm Communication Collectives Library (RCCL).

Многие платформы DL поддерживают распределенное обучение: Distributed TensorFlow, Horovod для TensorFlow и Keras, PyTorch, Caffe2, CNTK, Deeplearning4j (с использованием Apache Spark), MXNet/Gluon, PaddlePaddle (фреймворк Baidu, название которого является аббревиатурой от PArallel Distributed Deep LEarning) , есть даже Apache SINGA (который, похоже, активно не развивается).

Эти решения обеспечивают близкое к линейному ускорение количества карт. Вот бенчмарк на основе CNTK с использованием NCCL 2:

Source

А вот бенчмарк от Uber’s Horovod:

Производительность обучения модели с использованием 128 GPU впечатляет и недалеко от идеального случая.Аналогичные результаты поделились Baidu (Хоровод фактически построен на их работе), и недавно Baidu опубликовала еще одну интересную статью о масштабировании глубокого обучения.

Короче говоря, распределенное обучение на графических процессорах теперь является товаром.

NVIDIA NVLink — это энергоэффективный канал с высокой пропускной способностью между GPU и CPU.

Помните часть о процессорах, мы говорили о конфигурациях x8/x16 для PCIe. PCI Express 3.0 (PCIe v.3) допускает 985 МБ/с на 1 линию, поэтому 15.75 ГБ/с для x16-линков (то есть вдвое медленнее для x8-конфигурации). Это скорость, с которой ваш процессор обменивается данными с вашим графическим процессором.

PCIe v.4 (выпущен осенью 2017 г., мы, вероятно, увидим поддержку Intel в 2018 г. и AMD в 2020 г., и кстати, он уже доступен в чипе IBM POWER9, но в этом чипе есть кое-что еще лучше!) позволяет вдвое более быстрая связь (31,51 ГБ/с для x16), PCIe v.5 (выйдет в 2019 г.) поддерживает в два раза более высокие скорости (63 ГБ/с для x16).

НВЛинк 1.0/2.0 позволяет использовать 80/150 ГБ/с . Так что это может иметь смысл даже для одного GPU. И есть процессоры, поддерживающие это. IBM POWER8+ и более поздние версии позволяют подключать до четырех устройств NVLink напрямую к чипу. POWER9 поддерживает NVLink 2.0. Жаль у нас таких десктопов нет в наличии.

Вот эталон пропускной способности Host-GPU в различных конфигурациях. А вот еще один игровой бенчмарк RTX 2080 Ti в разных конфигурациях. А вот бенчмарк Radeon между PCIe 2.0, 3.0 и 4.0.

В дополнение к ускорению обмена данными между ЦП для систем с подключением ЦП NVLink, NVLink также может обеспечить значительный прирост производительности при обмене данными между ГП (одноранговыми). Это еще круче! Два или более графических процессора могут взаимодействовать друг с другом напрямую без необходимости передачи данных через центральный концентратор, ЦП . Распределенное обучение должно быть быстрее с NVLink.

Исходная статья

Вот документ, в котором основное внимание уделяется преимуществам одноранговой связи от NVLink.

Передача данных — не единственная работа GPU, поэтому реальная польза будет меньше, чем соотношение между пиковыми скоростями передачи данных, но в реальных задачах помогает. Вот пример расчета 3D FFT (я думаю, что это наиболее близко к нейронным сетям среди случаев в статье):

Исходная статья

Ускорение более чем в 2 раза для графических процессоров, подключенных к NVLink, по сравнению с графическими процессорами, подключенными к PCIe 3.0. Это классно.

У AMD есть похожая технология под названием Infinity Fabric.

Еще одно преимущество NVLink.В CUDA 6 NVIDIA представила «одно из самых значительных улучшений модели программирования в истории платформы CUDA» — унифицированную память .

Unified Memory создает пул управляемой памяти, совместно используемой ЦП и ГП, устраняя разрыв между ЦП и ГП. Управляемая память доступна как ЦП, так и ГП с помощью одного указателя. Суть в том, что система автоматически переносит данные, выделенные в унифицированной памяти, между хостом и устройством, чтобы они выглядели как память ЦП для кода, выполняемого на ЦП, и как память ГП для кода, выполняющегося на ГП.

https://devblogs.nvidia.com/unified-memory-in-cuda-6/

При пропускной способности 80 ГБ/с или выше на машинах с ЦП и ГП, подключенными к NVLink, это означает, что ядер ГП смогут получить доступ данные в памяти хост-системы с той же пропускной способностью, что и у ЦП для этой памяти (для четырехканальной DDR4–3200 это должно быть 4 * 25600 МБ/с = около 100 ГБ/с, это ниже, чем пропускная способность NVLink 2.0) — намного быстрее чем PCIe. Компоненты приложений, относящиеся к хосту и устройству, смогут гораздо эффективнее обмениваться данными и совместно работать с общей структурой данных, а поддержка больших размеров задач станет проще, чем когда-либо.

https://devblogs.nvidia.com/how-nvlink-will-enable-faster-easier-multi-gpu-computing/

Как это может помочь для приложений глубокого обучения? Очевидно, теперь вы не ограничены размером памяти GPU. Многие приложения могут извлечь из этого пользу.

Посмотрите эту классную презентацию!

Если бы у нас была только система POWER9… (см. ниже)

Похоже, что текущие платформы DL не поддерживают унифицированную память. И я не слышал, чтобы где-то еще были какие-то планы. Вероятно, вам придется писать его с нуля, используя CUDA/cuDNN.Но есть похожее движение, посвященное поддержке крупных моделей.

На NIPS’17 Alibaba представила документ «Обучение более глубоких моделей с помощью оптимизации памяти графического процессора в TensorFlow» с аналогичным подходом без использования унифицированной памяти. Они заявляют, что «наши тесты показывают, что она [унифицированная память] может привести к серьезной потере производительности (максимум в десять раз)» , и предложили общий подход, называемый «своп-аут/вход», который предназначен для любого типа нейронная сеть.Кроме того, они разработали алгоритм внимания с эффективным использованием памяти для моделей Seq2Seq. Аналогичный подход от IBM описан ниже.

Я ожидаю, что скоро эти идеи будут перенесены в практическую область (будут интегрированы в фреймворки DL), потому что ограниченная память графического процессора является серьезным ограничением.

В системах с процессорами x86 (например, Intel Xeon) подключение к графическому процессору осуществляется только через PCI-Express (хотя графические процессоры могут подключаться друг к другу через NVLink).В системах с процессорами POWER8/9 подключение к графическому процессору осуществляется через NVLink (в дополнение к NVLink между графическими процессорами).

NVLink вообще не про игровые карты. Он доступен для профессиональных карт NVIDIA, таких как Quadro и Tesla.

(сентябрь 2018 г.) Игровые карты Turing теперь имеют NVLink!

Графические процессоры TU102 и TU104 (Titan RTX, RTX 2080/2080 Ti, но _НЕ_ 2070) включают в себя второе поколение высокоскоростного межсоединения NVLink от NVIDIA, изначально разработанного для графического процессора Volta GV100, обеспечивающего высокоскоростную работу с несколькими графическими процессорами. подключение для SLI и других вариантов использования нескольких GPU.NVLink позволяет каждому графическому процессору напрямую обращаться к памяти других подключенных графических процессоров, обеспечивая гораздо более быструю связь между графическими процессорами, и позволяет объединять память нескольких графических процессоров для поддержки гораздо больших наборов данных и более быстрых вычислений в памяти.

Графический процессор Turing TU102 (Titan RTX/RTX 2080 Ti) включает два канала NVLink второго поколения x8, а Turing TU104 (RTX 2080) включает один канал NVLink второго поколения x8. Каждое соединение обеспечивает пиковую пропускную способность 25 ГБ/с в каждом направлении между двумя графическими процессорами (пропускная способность 50 ГБ/с в обоих направлениях).Два канала в TU102 обеспечивают 50 ГБ/с в каждом направлении или 100 ГБ/с в обоих направлениях.

Итак, размещение двух 2080 Ti и подключение их по NVLink кажется полезным. Таким образом, вы получите GPU с памятью 22 Гб и интерконнектом 100 Гб/с.

На GTC’18 NVIDIA анонсировала NVSwitch, способную поддерживать 16 полностью подключенных графических процессоров в одном серверном узле и обеспечивать одновременную связь между всеми восемью парами графических процессоров на скорости 300 ГБ/с каждая. Эти 16 графических процессоров можно использовать как один масштабный ускоритель с 0.5 терабайт единого пространства памяти и производительность 2 PFLOPS FP16.

https://www.nvidia.com/en-us/data-center/nvlink/

ИИ вступает в эпоху демократизации. Это происходит на разных уровнях. Одним из уровней является аппаратный уровень.

Вычислительная мощность становится не только больше, но и доступнее. Работа Google по крупномасштабному неконтролируемому обучению 2011 года (помните, что работа с NN обработала 10 миллионов изображений и нашла кошачью мордочку) была воспроизведена в 2013 году с гораздо меньшими ресурсами.Вот история Wired об этом. Сравнение цен в статье Wired ($1M → $20K) и на слайдах NVIDIA ($5M → $33K) различается, но тенденция очевидна. Графический процессор изменил правила игры, а глубокое обучение (с хорошими результатами) стало гораздо более доступным.

Источник

Существует список ТОП500 суперкомпьютеров, измеренных тестом LINPACK по операциям с плавающей запятой двойной точности (FP64). Бенчмарк решает плотную систему линейных уравнений. Помните, что для нейронных сетей обычно используются FP32/FP16, и NVIDIA любит сообщать об их производительности с точки зрения вычислений FP16 (что понятно, потому что это дает в 4 раза большие числа).

Возьмем, к примеру, NVIDIA GTX Titan V с пиковой производительностью FP64 6900 GFLOPS = 6,9 TFLOPS. Соответствует лучшему суперкомпьютеру мира 2001–2002 гг. (IBM ASCI White с пиковой скоростью 7,226 TFLOPS) и суперкомпьютеру на 500-м месте (по-прежнему крутой суперкомпьютер) списка ТОП500 в ноябре 2007 г. (начальный уровень в списке был 5,9 Тфлоп/с).

Сравнивать показатели производительности FP16/FP32 с FP64 некорректно, но для задач, допускающих меньшую точность (нейронные сети могут) и с точки зрения числовых уравнений, решаемых в единицу времени, современная игровая карта NVIDIA GTX 1080 Ti (с пиковая производительность более 10 TFLOPS FP32) — настольный суперкомпьютер недавнего прошлого.

Вот новостная статья 2002 года о суперкомпьютере с производительностью 11 терафлопс:

«Диапазон обработки от 1 до 10 терафлопс открывает революционные возможности для научных приложений. Это качественно отличается от того, что мы могли делать раньше», — сказал Сигер. Разница заключается в количестве переменных, которые компьютер может обрабатывать одновременно, и в разрешении моделирования. По его словам, симуляции не только намного ближе к реалистичным физическим экспериментам, но и требуется гораздо меньше времени, чтобы приблизиться к разумному приближению.Этот тип возможностей поднимает компьютерное моделирование на тот же уровень, что и физический эксперимент и теория, поэтому он позволит нам выполнять революционную научную работу». и в принципе может быть научной лабораторией разумного прошлого, проводящей исследования мирового уровня. Но кого это волнует?.. Все считают хэши…

Быстрый рост производительности суперкомпьютеров, по данным сайта top500.org. Логарифмическая ось y показывает производительность в GFLOPS.[Источник]

Итак, тенденция продолжается, и современный 500-й суперкомпьютер в мире будет через 10 лет на вашем рабочем столе (а может в телефоне, часах, куртке, зубной щетке, под кожей? помните, размер пакет «10 TFLOPS» тоже резко сократился).

Для сравнения, мобильный процессор Huawei Kirin 970 (уже в смартфонах, подробнее о мобильном ИИ в следующих постах) с процессором нейронной сети (NPU) на борту, как говорят, обеспечивает 1,92 TFLOPS FP16. Это самый производительный суперкомпьютер 1997 года (но вспомните еще раз разницу между FP16/FP64).

NVIDIA DGX

NVIDIA тоже на этой волне. Есть два суперкомпьютера глубокого обучения, называемые сервером DGX-1 и станцией DGX.

DGX-1 (решение для монтажа в стойку 3U) начинался с 8xTESLA P100 (DGX-1P), теперь обновлен до 8xTESLA V100 (DGX-1V), обеспечивая около 1000 TFLOPS или 1 PFLOPS FP16 (но только 62,4 TFLOPS FP64, здесь не 1/ 4 производительности FP16, потому что производительность FP16 измеряется для тензорных ядер, которые работают только с FP16, поэтому для TESLA V100 это всего 8*5300 TFLOPS FP64).По производительности FP16 он близок к FP64 (да, опять же, это не тот способ сравнения) производительности суперкомпьютера №1 2008–2009 годов (Roadrunner с 1,105 PFLOPS) и может быть в списке ноября 2017 года.

Кстати, есть #149 DGX SaturnV Volta36 (1,8 PFLOPS, 97 кВт, немного V100, может быть, 36 DGX-1V?) и #36 DGX Saturn V (4,9 PFLOPS, 349,5 кВт, состоит из 124 DGX-1P с P100), готовые к запуску. быть модернизирована до новой, состоящей из 660 узлов по 8xV100 каждый, в результате чего в общей сложности 5280 ускорителей Volta GPU дают 40 PFLOPS FP64 (и теоретически 660 PFLOPS FP16 на тензорных ядрах), что теоретически сделает ее одной из десяти лучших систем в мир даже с плавающей запятой двойной точности.Это поразительно.

Кстати, какую нейронную сеть вы бы обучили, если бы у вас был в наличии этот суперкомпьютер с производительностью 660 PFLOPS?

DGX-1 с P100 стоит 129 000 долларов, DGX-1 с V100 — 149 000 долларов.

На GTC’18 NVIDIA анонсировала DGX-2, машину с 16 TESLA V100 32 ГБ (вдвое больше графических процессоров с вдвое большим объемом памяти на каждый GPU, чем у предыдущего V100), в результате чего общая память графического процессора HBM2 составляет 512 ГБ, системная память — 1,5 ТБ, а производительность — 2 PFLOPS. Производительность FP16.

DGX-2

С DGX-2 у вас в 4 раза больше памяти и в 2 раза больше производительности по сравнению с DGX-1.

DGX-2 стоит 399 000 долларов.

Вот более подробное сравнение цены и качества DGX-1 и DGX-2.

DGX Station (настольное/офисное решение) представляет собой экономичную промежуточную точку для приобретения оптимизированных по производительности рабочих станций с ускоренными вычислениями за половину цены и вдвое меньшей производительности по сравнению с аналогом в форм-факторе сервера (DGX-1). Он позиционируется как «первый в мире персональный суперкомпьютер для передовой разработки искусственного интеллекта». IDC ожидает, что эта тенденция сохранится.

Он содержит 4xTESLA V100 и обеспечивает до 500 TFLOPS FP16 (пиковая производительность). Сейчас он продается за 49 900 долларов (обычная цена — 69 000 долларов).

Теперь речь идет о том, чтобы просто поместить несколько TESLA V100 в одну машину, есть также NVLink (что, как мы знаем, круто!) соединений между графическими процессорами, 4x 100 Гбит сетевых карт InfiniBand и, возможно, некоторые другие оптимизации. Как и многие традиционные рабочие станции, станция DGX разработана для работы с низким уровнем шума. Он использует стандартную розетку 115–240 В переменного тока и может потреблять до 1500 Вт.

IBM Minsky и т.д.

Многие слышали о DGX, но мало кто знает, что у IBM есть аналогичный проект под названием Minsky.

Power Systems S822LC («Минский»)

В сентябре 2016 г. IBM представила Power Systems S822LC для высокопроизводительных вычислений (кодовое название «Минский»), содержащую два процессора Power8 (8–10 ядер каждый) и четыре Графические процессоры Nvidia Tesla P100. «Минский» был второй системой на рынке, использующей графический процессор Nvidia P100 (первой была DGX-1).

Источник

Важное отличие от машины DGX-1 от Nvidia заключается в том, что DGX-1 использует порты NVLink для соединения 8*карт Tesla P100 SMX2, но карты устанавливаются на материнскую плату с двумя процессорами Haswell Xeon E5 v3 от Intel а связь GPU-CPU использует обычные ссылки PCI-Express через четыре коммутатора PCI:

https://www.nextplatform.com/2016/09/08/refreshed-ibm-power-linux-systems-add-nvlink/

В машине Minsky IBM также использует порты NVLink на процессоре Power8 для связи GPU-CPU. Два соединения NVLink между ЦП POWER8 и графическими процессорами Tesla P100 обеспечивают передачу данных в 2,5 раза быстрее, чем традиционные серверы на базе Intel x86, использующие PCIe x16 Gen3:

https://www.ibm.com/blogs/systems/ibm- nvidia-present-nvlink-server-youve-waiting/

Итак, машина DGX-1, которую Nvidia настроила специально для глубокого обучения, имеет больше графических процессоров, но они менее тесно связаны с процессорами Intel Xeon и имеют меньшую пропускную способность. также между графическими процессорами.

В системе IBM меньше графических процессоров и больше пропускная способность между вычислительными элементами. IBM нацеливает этот блок Минского на рабочие нагрузки HPC, но нет никаких причин, по которым его нельзя использовать для глубокого обучения.

По данным The Next Platform: «С двумя десятиядерными чипами Power8, работающими на частоте 2,86 ГГц, 128 ГБ оперативной памяти и четырьмя ускорителями Tesla P100, Бодей говорит, что IBM будет взимать менее 50 000 долларов. Nvidia берет 129 000 долларов за систему DGX-1 с восемью картами Tesla, а также стек программного обеспечения для глубокого обучения и его поддержку.Другими словами, цены IBM Minsky соответствуют ценам Nvidia DGX-1».

Цена называется «IBM Power System S822LC для коммерческих вычислений», но кажется, что эти машины не имеют графических процессоров.

Существует еще один продукт под названием «IBM Power System S822LC для высокопроизводительных вычислений» с 4 процессорами TESLA P100, но цена указана в разделе «Свяжитесь с нами».

Апрель 2017 г. IBM объявила, что эти серверы планируется включить в вычислительную инфраструктуру Bluemix, но я не могу их найти.В настоящее время существует только 4 сервера POWER8 без ПО, ни один из которых не имеет графических процессоров, и все серверы с графическими процессорами являются серверами Intel Xeon.

Power Systems AC922 («Newell»)

5 декабря 2017 г. IBM представила свои серверы на базе POWER9, предназначенные для корпоративного ИИ. Power Systems AC922 — более свежий и гораздо более интересный вариант. AC922, известный под кодовым названием «Уизерспун» или «Ньюэлл», является строительным блоком систем CORAL, развертываемых Министерством энергетики США — «Саммит» в Ок-Риджской национальной лаборатории и «Сьерра» в Ливерморской национальной лаборатории имени Лоуренса. Лаборатория.

IBM POWER GPU Intensive Roadmap / Источник

Он содержит 2 ЦП POWER9 (доступны в конфигурациях с числом ядер от 16 до 44) и 2–6 графических процессоров NVIDIA Tesla V100 с NVLink. AC922 расширяет многие элементы дизайна, представленные в Power8». Minsky» с упором на обеспечение возможности подключения к ряду ускорителей — графическим процессорам Nvidia, ASIC, FPGA и устройствам, подключенным к PCIe, — с использованием набора интерфейсов. Новые системы не только являются первыми серверами с интерфейсом PCIe Gen4, но и поддерживают NVLink 2.0 и OpenCAPI, которые, по данным IBM, предлагают почти в 10 раз большую пропускную способность по сравнению с системами x86 на базе PCI-E 3.0.

POWER AC922 Design — 6 GPU / Source

Подробнее о AC922 здесь.

До сих пор Intel фактически была монополистом в области серверных чипов, владея более чем 90 процентами рынка. Но с Power9 IBM надеется захватить 20 процентов рынка к 2020 году. удалось масштабировать фреймворки глубокого обучения до 256 графических процессоров с эффективностью до 95 процентов):

IBM PowerAI Platform / Source

PowerAI требует установки на IBM Power Systems S822LC для серверной инфраструктуры HPC или AC922 (подробнее о выпусках PowerAI).

Среди интересных функций, разработанных IBM, — поддержка больших моделей (LMS) . LMS использует системную память в сочетании с памятью графического процессора, чтобы преодолеть ограничения памяти графического процессора в обучении глубокому обучению. И это вполне логично для такой системы, как AC922 (вспомните раздел Unified Memory в обсуждении NVLink).

Вот результаты запуска 1000 итераций увеличенной модели GoogLeNet (размер мини-пакета = 5) на увеличенном наборе данных ImageNet (размер кадра
2240×2240, т. е. изображения в 100 раз больше, чем в обычном ImageNet) на двух платформах ( ключевое различие между двумя платформами заключается в NVLink 2.0):

В соответствующем документе IBM (из конференции SysML’18, состоявшейся 15-16 февраля 2018 г.) дополнительно говорится: «Мы также заметили, что LMS может повысить производительность обучения за счет максимального использования графического процессора. Для Resnet-152 в Caffe максимальный размер пакета без LMS составлял 32, а соответствующая пропускная способность — 91,2 изображения/сек. С помощью LMS мы смогли увеличить размер пакета до 48 и повысить пропускную способность до 121,2 изображений в секунду, несмотря на накладные расходы на обмен данными между CPU и GPU».

Доступны дополнительные тесты LMS.

POWER9 с NVLink выглядит круто. Подробнее о тестах AI/HPC здесь.

Серверы Microway AC922 стоят от 55 000 до 75 000 долларов США. Есть и другие варианты. Например, Microway продает серверы 2*Xeon + 2–4 V100 по цене от 24 000 до 75 000 долларов и серверы OpenPOWER с 2*POWER8 + 2–4 сервера P100 по цене от 35 000 до 75 000 долларов.

Еще анализ AC922.

Возможно, мы увидим интересные анонсы на конференции IBM Think 2018 с 19 по 22 марта.

Самодельные суперкомпьютеры

Хотел бы я иметь в наличии AC922, но решения DGX и IBM относятся к корпоративному ценовому диапазону, а не для энтузиастов ИИ/SMB.Значит, нужны другие решения.

Я ожидаю, что здесь будет воспроизведен случай с Hadoop и обычным оборудованием.

Одним из самых мощных решений этого типа является эталонная сборка DeepLearning11 от STH.

Это однокорневая конструкция с 10-кратным NVIDIA GeForce GTX 1080 Ti, форм-фактор 4,5U. Это дает вам теоретическую пиковую производительность около 100 TFLOPS FP32 и 110 ГБ памяти. 8 Tesla V100 SXM2 будет иметь в общей сложности 125 TFLOPS FP32 (внимание, NVIDIA обычно сообщает не FP16) и 128 Гб памяти.См. обсуждение HN по этому поводу.

Общая стоимость около $16 500 (предполагаю, что текущие затраты будут выше, т.к. цены выросли с лета 2017 года). Сравните это с DGX-1. Да, NVLink здесь нет, других оптимизаций, может быть, нет, да и проблемы есть (например, нет нормальной поддержки FP16), но по соотношению производительность/цена решение крутое.

Если вам нужна такая мощность, но вы не можете позволить себе DGX-1, единственный вариант прямо сейчас — использовать облако. Но облако дорогое.Инстансы AWS EC2 p3.16xlarge (8*Tesla V100 с NVLink) с текущей ценой по требованию 24,48 долларов США обойдутся вам в 17 625 долларов США за 30-дневную эксплуатацию.

Весь DeepLearning11 дешевле. Да, добавьте расходы на электроэнергию на собственный сервер и другие расходы. Но все равно круто. Выбор в основном очевиден, если вам нужно широко использовать графические процессоры. Облако слишком дорого.

На рынке есть и другие решения (например, этот сервер 8*1080 Ti, и вы легко можете найти больше).

(сен 2018 года) Есть Некоторые объявлены Личные суперкомпьютеры с использованием RTX 2080 Ti . Я думаю, что вы можете найти больше из них в Интернете.

С практической точки зрения хорошо то, что входные барьеры становятся ниже.

FP32

Прямо сейчас, если вы ориентируетесь на производительность FP32, наиболее выгодной по цене видеокартой кажется GTX 1080 Ti (сейчас цены выросли с почти 700 долларов до более чем 1100 долларов).

(сентябрь 2018 г.) RTX 2080 Ti мог бы быть более экономичным для конкретной задачи из-за лучшей производительности (тут меня интересует только FP32) + пропускной способности памяти + энергоэффективности, но это зависит от цены, которую вы можете получить 2080 Ti или 1080 Ти. Последние должны стать дешевле. Основная прибыль RTX — в FP16.

GTX Titan Xp (~1600 долларов) обеспечивает почти аналогичную производительность с немного большей памятью (12 Гб против 11 Гб) и пропускной способностью, но разница в цене не обязательно того стоит. Кстати, не путайте Titan Xp с Titan X (Pascal) и Titan X (Maxwell).Это три разные карты с разными чипами и производительностью. Вы можете увидеть различия в моей таблице сравнения графических процессоров.

Titan V ($3000) на 30% быстрее (опять же, сейчас я говорю о FP32), но слишком дорого.

(апрель 2019 г.) Titan RTX (~$2500) значительно изменили ландшафт даже в FP32. Во-первых, 24 Гб памяти впечатляют и дают гораздо больше свободы. Во-вторых, это быстрее. В-третьих, его возможности FP16.

Карты Tesla и Quadro чрезвычайно дороги, и большинство исследователей и практиков вместо них используют игровые карты. Единственная важная практическая ниша для Tesla может быть, если вы строите свой собственный центр обработки данных. Недавно NVIDIA запретила использование Geforce в дата-центрах и не любит поставщиков серверов, которые используют игровые карты Geforce вместо Quadro и Tesla.

Если вас волнует не чистая производительность, а больше соотношение производительность/цена и/или производительность/мощность (что в общем-то разумно), ситуация немного сложнее.

По соотношению производительность/мощность (GFLOPS на ватт) архитектура Volta является лучшей (даже если не принимать во внимание Tensor Cores/FP16). Среди архитектуры Pascal более скромные карты вроде обычных 1080 (не Ti) и 1070 Ti выглядят лучше (но незначительно). И помните, что у них меньше памяти и ниже пропускная способность.

(апрель 2019 г.) Архитектура Turing ( карты RTX ) ​​более эффективна с точки зрения GFLOPS/Ватт. Подробнее см. в таблице ниже.

Для сравнения производительности/цены вам необходимо постоянно пересчитывать эти коэффициенты, потому что цены меняются. Да и производители разные, поэтому один и тот же 1080 Ti доступен в десятках вариантов. Они не совсем одинаковы даже с точки зрения производительности. Есть карты с повышенной тактовой частотой, есть карты, специально предназначенные для разгона. Это может дать дополнительный прирост производительности, но не ожидайте, что он будет огромным, например. Asus ROG STRIX GTX 1080 Ti OC (версия для оверклокеров) имеет 11247 FP32 GFLOPS вместо обычных 1080 Ti с 10609 GFLOPS (увеличение почти на 6%).

Я использую для себя уже упомянутую таблицу сравнения графических процессоров и предлагаю сообществу взять флаг и расширить его (или создать отдельный сервис/репозиторий github/что угодно), чтобы включить разных производителей, добавить цифры производительности (или, по крайней мере, оценки ), и, возможно, реализовать регулярное обновление цен. Это может быть полезной услугой для сообщества.

FP16

С производительностью FP16 сложнее. Все игровые карты здесь не вариант, потому что их FP16 существенно ограничен.Единственным исключением, по-видимому, является Titan V. Он потенциально может достигать 27,6 TFLOPS FP16. Кроме того, он имеет тензорные ядра с теоретически возможной пиковой производительностью 110 TFLOPS. Если бы можно было получить такое ускорение…

Tesla V100 выглядит очень дорого, как и другие Tesla. Если Титан V действительно неограничен в FP16, то разница между Титаном и Теслой значительно уменьшается. Но он до сих пор существует (NVLink и так далее).

(сен 2018) RTX 2080 Ti 0 и и

60 Вся RTX Series , кажется, очень хороший вариант сейчас, потому что FP16 не ограничивается, и эти карты имеют тензор ядра.Плюс лучшая пропускная способность памяти, NVLink и так далее.

(апрель 2019) Titan RTX с памятью 24 Гб сейчас очень интересный вариант.

См. диаграммы производительности выше.

INT8

Если вы планируете проводить инференс на GPU, то выбор аналогичен FP32, хорошая игровая карта выглядит вполне прилично.

(сентябрь 2018 г.) Особенно игровая карта серии RTX .Вспомните его тензорные ядра и поддержку INT4 (и, возможно, INT1)

Опять же, см. диаграммы производительности выше.

Обещал рассказать про AMD.

графических процессоров

Что насчет графических процессоров AMD (я имею в виду Radeon), они кажутся очень хорошими (и криптомайнеры могут это подтвердить), особенно учитывая их неограниченную производительность FP16 (я имею в виду 2x FP32). Radeon RX Vega 64 обещает обеспечить производительность до 23 TFLOPS FP16, что очень хорошо.

Если бы это могли поддерживать только фреймворки…

OpenCL

Изначально он начинался с OpenCL.

Есть какие-то попытки вроде OpenCL Caffe, но неясные планы на Caffe2, нет официальной поддержки в Tensorflow (но есть и неофициальные), нет поддержки PyTorch и так далее.

Команда PyTorch сказала:

«Официально мы не планируем какую-либо работу с OpenCL, потому что:

  • AMD, кажется, движется в сторону HIP/GPUOpen, который имеет транспилятор CUDA (и они проделали некоторую работу по транспиляции Серверная часть Torch)
  • Intel переводит свою скорость и оптимизацию в MKLDNN
  • Универсальная поддержка OpenCL имеет значительно худшую производительность, чем использование CUDA/HIP/MKLDNN, где это уместно.

ROCm/HIP/MIOpen

Radeon Open Compute Platform ( ROCm ) — это платформа HPC/Hyperscale с открытым исходным кодом для вычислений на GPU. Текущая версия 1.7.

Интерфейс гетерогенных вычислений для переносимости ( HIP ) — это API среды выполнения C++ и язык ядра, который позволяет разработчикам создавать переносимые приложения, которые могут работать на AMD и других графических процессорах. Это позволяет разработчикам писать приложения с использованием общего синтаксиса C++ и API.Полученный код C++ можно скомпилировать с помощью HCC от AMD и NVCC от Nvidia. Код HIP обеспечивает такую ​​же производительность, как собственный код CUDA, плюс преимущества работы на платформах AMD.

Поскольку и Cuda, и HIP являются языками C++, перенос с Cuda на HIP намного проще, чем перенос с Cuda на OpenCL. Чтобы еще больше сократить время обучения при переходе с Cuda на HIP, AMD разработала инструмент hipify для автоматизации преобразования ядра вашего приложения.

По сравнению с OpenCL HIP предлагает несколько преимуществ.Вот сравнение синтаксиса между Cuda/HIP/OpenCL.

MIOpen — это библиотека AMD Machine Intelligence, библиотека с ускорением на графическом процессоре для алгоритмов машинного обучения, похожая на cuDNN. Вот руководство по переносу с cuDNN на MIOpen.

https://rocm.github.io/dl.html по состоянию на 14.03.2018

Поддержка фреймворка ROCm в основном продолжается. Сейчас выглядит готовым только Caffe (подробнее), и идет активная работа над Tensorflow (подробнее).

Я думаю, что отсутствие поддержки фреймворка сейчас является основным препятствием.Графические процессоры хороши и интересны, но их сложно использовать с большинством фреймворков.

Есть и другие интересные фреймворки, такие как PlaidML от Vertex.AI. Он поддерживает AMD R9 Nano, RX 480 и Vega 10. Вы можете запускать Keras CNN поверх PlaidML, но у решения есть некоторые существенные ограничения (например, отсутствие поддержки RNN). Посмотрите обсуждение на HN.

Возможно, помогут такие проекты, как NNVM/TVM. Серверная часть ROCm для графических процессоров AMD поддерживается в TVM. Кажется, решение подходит для развертывания моделей, уже обученных в разных фреймворках (благодаря поддержке ONNX/CoreML и MXNet/Keras), на другом оборудовании, но я не уверен, что вы можете использовать его для обучения прямо сейчас.

Источник

Infinity Fabric

Infinity Fabric (IF) — это когерентное соединение (когерентность кэша поддерживается между несколькими процессорами) для использования на микросхеме, в многочиповом модуле (MCM) и для межсокетного соединения.

При сравнении IF с NVLink есть разница. В то время как NVLink может обеспечить быструю передачу данных между CPU/GPU, IF также может использоваться внутри чипа (CPU или GPU).

https://www.nextplatform.com/2017/07/12/heart-amds-epyc-comeback-infinity-fabric/

Использование Infinity Fabric на Vega 10 (ядро карт Vega 64/56) является частью Усилия AMD по разработке надежной структуры и ее последующему использованию во всей компании.Vega 10 — первый графический процессор AMD, созданный с использованием межсоединения Infinity Fabric. В Vega 10 Infinity Fabric связывает графическое ядро ​​и другие основные логические блоки чипа, включая контроллер памяти, контроллер PCI Express, процессор дисплея и блоки ускорения видео. [источник]

Кажется, что прямо сейчас, как конечный пользователь GPU, вы не можете получить никакой прибыли от IF. Его использование в Vega 10 связано с внутренней архитектурой чипа, а не с взаимодействием между CPU/GPU.Поправьте меня если я ошибаюсь. Мне непонятно, дает это что-то или нет в конфигурации с Threadripper/EPYC + Radeon.

Вот интересная фраза Раджи Кодури, [бывшего] старшего вице-президента и главного архитектора AMD Radeon Technologies Group (сейчас старший вице-президент Core and Visual Computing Group, генеральный менеджер по решениям для периферийных вычислений и главный архитектор в Intel Corporation): «Мы не упомянули какие-либо конструкции с несколькими графическими процессорами на одном ASIC, например Epyc, но такая возможность возможна с Infinity Fabric. сказал он. И есть предположения, что со следующей архитектурой графического процессора AMD, Navi, будут многочиповые модули. То же самое говорится и о NVIDIA.

Для межсокетного соединения IF обеспечивает 37,9 ГБ/с на канал, что в сумме составляет 152 ГБ/с между сокетами. Это сравнимо с NVLink 2.0, который дает 150 ГБ/с.

Будущее

На выставке CES 2018 AMD анонсировала новое поколение Vega, предназначенное для приложений глубокого обучения, а не для геймеров: /O» отличаться от Infinity Fabric.Даже неясно, увидим ли мы эти карты на рынке в 2018 году. Ждем подробностей.

Текущая дорожная карта графических процессоров на 2018 год выглядит так:

И опять же, без поддержки фреймворка эти графические процессоры будут бесполезны.

Говоря об AMD, нельзя не упомянуть и Intel (особенно если учесть, что глава AMD Radeon Group перешел в Intel).

У Intel также есть графические процессоры. Они называются HD Graphics.

Собственно, под него и ориентирована значительная часть потребительских чипов вроде Core-i7.Например, в 4-ядерном i7-7700 он занимает почти половину поверхности чипа:

i7-7700 аннотированный снимок кристалла (источник)

В i7-7700 стоит UHD Graphics 630 с пиковой производительностью до 883,2 GFLOPS FP16 (в режиме Boost 1150 МГц).

Текущее топовое решение микроархитектуры GPU Gen9.5, Iris Plus Graphics 650 имеет пиковую производительность до 1,7664 TFLOPS FP16, что, кстати, значительно выше, чем у NVIDIA Titan Xp (0,1686 TFLOPS FP16, помните, NVIDIA ограничивает FP16). производительность на игровых картах) и присутствует даже в некоторых Core-i3.Для производительности FP32 (883,2 GFLOPS) это не так круто, но сравнимо с i7-6850K (по нашим оценкам около 690 GFLOPS). Таким образом, потенциальная комбинированная производительность (ЦП + HD-графика) может быть почти в два раза выше.

Помните, что Intel Inference Engine также поддерживает Intel HD Graphics.

Создается впечатление, что чипы Intel, хоть и сильно отстают от GPU NVIDIA/AMD в типичных задачах DL, здесь несколько недооценены. А учитывая, что есть задачи ГО, которые далеки от пиковой производительности (т.грамм. обучение RNN), эти возможности могут быть интересны.

Еще более интересным является недавний шаг Intel + AMD по включению графического процессора Vega в новые процессоры Intel!

Подробнее об этом здесь.

Прямо сейчас Intel находится на пути к собственному дискретному графическому процессору под названием Intel Xe. Его отправка запланирована на середину 2020 года.

Дизайн карты Intel Xe

7 лучших мини-и низкопрофильных видеокарт (AMD и NVIDIA)

Если вы хотите собрать игровой ПК малого форм-фактора, в этом руководстве мы перечислили семь лучших низкопрофильных видеокарт в различных ценовых категориях и с разными уровнями производительности, чтобы помочь вам найти правильный вариант для вашего ПК. система.

До тех пор, пока несколько лет назад не начался рост интереса к системам малого форм-фактора, было не так много вариантов мини-компонентов или низкопрофильных компонентов. В настоящее время все больше и больше компьютерного оборудования и компонентов становятся доступными в меньших размерах. Видеокарты ничем не отличаются. Хотя на рынке все еще не так много мини- или низкопрофильных видеокарт, сейчас их определенно больше, чем было в прошлом. На самом деле, теперь доступны видеокарты малого форм-фактора, которые содержат одиночные графические процессоры самого высокого класса.А это значит, что если вы хотите создать игровой ПК малого форм-фактора, у вас никогда не было большего потенциала для создания высокопроизводительной системы в корпусе меньшего размера, чем сегодня.

В этом руководстве мы рассмотрим семь лучших низкопрофильных видеокарт в различных ценовых категориях и с разными уровнями производительности. Итак, если вы планируете построить меньшую систему, ниже представлены варианты компактных видеокарт, которые удовлетворят ваши потребности независимо от того, есть ли у вас больший или меньший бюджет.

*ПРИМЕЧАНИЕ. Следует отметить, что в этом руководстве мы рассмотрели два разных типа видеокарт малого форм-фактора: мини-видеокарты и низкопрофильные видеокарты. Низкопрофильные видеокарты не такие длинные и высокие, как стандартные видеокарты, а мини-видеокарты не такие длинные, как стандартные видеокарты, но обычно имеют одинаковую высоту. Итак, если для вашей сборки будет проблемой высота зазора, вы можете придерживаться низкопрофильных вариантов ниже.

Краткий обзор лучших низкопрофильных видеокарт

Чтобы помочь вам принять решение как можно проще, мы предоставили краткую таблицу ниже, в которой перечислены наши лучшие выборы лучших низкопрофильных и мини-видеокарт в различных категориях. Мы выбрали лучшую мини-видеокарту высокого класса, лучшую в целом низкопрофильную видеокарту, лучший вариант среднего класса и лучшую доступную низкопрофильную видеокарту.

*Если вы хотите прочитать наш полный обзор каждой из перечисленных выше графических карт, нажмите «Читать обзор »», и вы перейдете к нашему обзору.Вы также можете прочитать обзоры наших наград Honorable Mention, прокрутив страницу вниз.

Лучшая мини-видеокарта:


ZOTAC GTX 1080 Ti
  • Миниатюрная видеокарта
  • 11 ГБ видеопамяти GDDR5
  • 8,3″ x 4,9″ (Д x В)
  • DisplayPort и HDMI

Наш рейтинг: 9,5 /10

Проверить цену на Amazon

Кто сказал, что большие вещи не бывают маленькими? Zotac Mini GTX 1080 Ti — первая видеокарта малого форм-фактора с флагманским графическим процессором.И если вы хотите собрать мощный мини-игровой ПК, способный запускать игры на мониторе 4K или мониторе 1440P 144 Гц, то Zotac Mini GTX 1080 Ti — ваш лучший выбор.

Конечно, Mini GTX 1080 Ti стоит чуть больше 650 долларов и не будет дешевым. Но если вы работаете с большим бюджетом и вам нужна самая мощная видеокарта меньшего размера, тогда вам подойдет Zotac Mini GTX 1080 Ti.

Карта имеет размеры 8,3 дюйма в длину и 4,9 дюйма в высоту, что определенно делает ее самым большим вариантом в этом списке.И если вы хотите собрать систему в тонком корпусе или в случае, когда высота зазора для графического процессора является проблемой, эта карта (и любая другая мини-карта) не подойдет.

Тем не менее, эта GTX 1080 Ti достаточно мала, чтобы поместиться в ряде популярных корпусов mini-ITX, включая NZXT h300i, Phanteks Enthoo Evolv ITX и Evolv Shift, Corsair 250D, BitFenix ​​Prodigy, Thermaltake Core X1. , и множество других.

В конечном счете, Zotac Mini GTX 1080 Ti — самая мощная мини-видеокарта, доступная в настоящее время.Другие варианты в этом списке ориентированы на более доступные варианты, тем более что самая мощная низкопрофильная карта — это GTX 1050 Ti. Тем не менее, вы также можете получить мини-GTX 1080, мини-GTX 1070 Tis и мини-GTX 1070, если вам нужна карта более высокого класса, но вы не хотите тратить ~ 650 долларов, которые потребуются для получения этого мини. видеокарта GTX 1080 Ti.

Лучшая низкопрофильная видеокарта:


ZOTAC GTX 1050 Ti
  • Низкопрофильная видеокарта
  • 4 ГБ видеопамяти GDDR5
  • 6.9″ x 2,8″ (Д x В)
  • DisplayPort, HDMI и DVI

Наш рейтинг: 8,6 /10

Проверить цену на Amazon

Если вам нужна видеокарта меньшей высоты, вы обнаружите, что не так много вариантов графических процессоров более высокого класса. Фактически, самый мощный графический процессор, доступный в низкопрофильном форм-факторе, — это GTX 1050 Ti. К счастью, GTX 1050 Ti будет предлагать достойную производительность и сможет играть в большинство игр на средних настройках , по крайней мере, на недорогом мониторе 1080P.

В настоящее время существует три разных GTX 1050Tis, но из доступных вариантов Zotac выделяется как лучший вариант, в основном потому, что он стоит примерно на 20 долларов дешевле, чем другие низкопрофильные GTX 1050 Ti, а во-вторых, потому что он имеет кулер с двумя вентиляторами, тогда как другие варианты имеют только одиночные вентиляторы.

Карта имеет длину 6,9 дюйма и высоту всего 2,8 дюйма, что означает, что она также будет хорошим вариантом для тонких мини-корпусов.

В целом, хотя GTX 1050 Ti не позволит вам погрузиться в игры со сверхвысоким разрешением или использовать монитор 1440P с частотой 144 Гц, если все, что вам нужно, — это хороший игровой опыт на мониторе 1080P, это видеокарта должна работать на вас.

Мини-графический процессор с лучшим соотношением цены и качества:


EVGA GTX 1060
  • Миниатюрная видеокарта
  • 6 ГБ видеопамяти GDDR5
  • 6,8″ x 4,4″ (Д x В)
  • DisplayPort, HDMI и DVI

Наш рейтинг: 9.0 /10

Проверить цену на Amazon

Если у вас есть место для более высокой видеокарты в вашей системе, EVGA GTX 1060 SC 6 ГБ будет хорошим обновлением по сравнению с Zotac GTX 1050 Ti, указанным выше, примерно на 100 долларов дороже.

EVGA GTX 1060 SC имеет размеры 6,8 дюйма в длину и 4,4 дюйма в высоту, поэтому она не поместится во многих сверхтонких корпусах, но она поместится во многих «укороченных» корпусах mini-ITX. .

Что касается производительности, вы можете рассчитывать на максимальную производительность в любой игре (даже в самых популярных сегодня) на мониторе 1080P с GTX 1060. GTX 1060 6 ГБ из-за возможности соединить его с доступным монитором FreeSync с частотой 144 Гц, к сожалению, мини-RX 580 не существует.(Тем не менее, есть небольшой RX 570, указанный в качестве нашего первого почетного упоминания, который станет хорошим выбором для всех, кто хочет соединить свою систему с монитором FreeSync.)

Но, хотя вы не можете соединить эту сборку с монитором FreeSync, вы можете соединить ее с монитором NVIDIA G-Sync. Мониторы G-Sync обойдутся вам довольно дорого, но мы составили список относительно доступных дисплеев G-Sync (и под этим мы подразумеваем, что нет мониторов дешевле ~350 долларов…)

В конечном счете, если у вас нет бюджета на покупку мини-видеокарты GTX 1080 Ti (или даже мини-GTX 1070), но вы хотите что-то, что сможет максимально использовать игры на мониторе 1080P, и у вас есть чехол, в который он поместится, эта мини-GTX 1060 6 ГБ станет для вас достойным вариантом.

Дешевая низкопрофильная видеокарта:


MSI Radeon RX 560
  • Низкопрофильная видеокарта
  • 4 ГБ видеопамяти GDDR5
  • 6,6″ x 2,7″ (Д x В)
  • DisplayPort, HDMI и DVI

Наш рейтинг: 8,4 /10

Проверить цену на Amazon

Для тех из вас, кто ищет доступную низкопрофильную видеокарту, которая обеспечит достойную производительность в играх на мониторе с разрешением 1080P, тогда низкопрофильная видеокарта MSI Radeon RX 560 может стать вашим выбором.

MSI RX 560 имеет размеры 6,6 дюйма в длину и 2,7 дюйма в высоту, что делает его одним из самых маленьких вариантов в этом списке. Что касается производительности, RX 560 ни в коем случае не является топовым вариантом. Тем не менее, он должен хорошо работать в играх с разрешением 1080P, поскольку он достаточно мощный, чтобы запускать практически любую игру, по крайней мере, с более низкими настройками на мониторе 1080P.

Если вы играете в такие игры, как Rocket League, League of Legends, Dota 2 или любую другую нетребовательную киберспортивную игру, RX 560 4GB предложит вам более чем достаточную производительность.И, поскольку это карта на базе AMD, она также будет прекрасно сочетаться с монитором FreeSync, что поможет вам еще больше в этих киберспортивных играх.

В конечном счете, RX 560 не обеспечит вам высокой игровой производительности. Тем не менее, он позволит вам играть в более требовательные игры на доступном мониторе 1080P и легко справится с нетребовательными играми. И, конечно же, он довольно доступен и имеет низкопрофильный форм-фактор, что делает его отличным вариантом для недорогих тонких игровых ПК.

Почетное упоминание №1:


SAPPHIRE Radeon RX 570
  • Миниатюрная видеокарта
  • 4 ГБ видеопамяти GDDR5
  • 6,7″ x 4,4″ (Д x В)
  • DisplayPort, HDMI и DVI

Наш рейтинг: 8,7 /10

Проверить цену на Amazon

Во многих отношениях мини-видеокарта SAPPHIRE Radeon RX 570 имеет больше смысла в качестве нашей лучшей видеокарты среднего класса, чем выбранная нами мини-карта GTX 1060 6 ГБ.Нет, RX 570 4 ГБ не превзойдет GTX 1060 6 ГБ ни в одной игре. Тем не менее, RX 570 в паре с монитором AMD FreeSync будет гораздо более доступной комбинацией, чем GTX 1060 в паре с монитором G-Sync.

Итак, если вы являетесь конкурентоспособным игроком (или любым другим игроком), который хочет собрать мини-ПК и и хочет использовать технологию переменной частоты обновления для максимально плавного игрового процесса, вы можете рассмотреть выбор RX 570 вместо GTX 1060, перечисленных выше, особенно если вас беспокоит цена.

Помимо этого, RX 570 4 ГБ предлагает вам достаточно хорошую производительность, чтобы вы могли максимально использовать практически любую игру на мониторе 1080P. У него не будет такой высокой средней частоты кадров, как у GTX 1060, но он по-прежнему должен обеспечивать идеальную производительность в большинстве игр (при разрешении 1080P).

Карта имеет размеры 6,7 дюйма в длину и 4,4 дюйма в высоту, поэтому она также соответствует EVGA GTX 1060.

В конечном счете, я бы рекомендовал RX 570, если у вас умеренный бюджет и в конечном итоге вы захотите использовать монитор AMD FreeSync с вашей системой.

Почетное упоминание № 2:


Gigabyte GTX 1050
  • Низкопрофильная видеокарта
  • 2 ГБ видеопамяти GDDR5
  • 6,6″ x 2,7″ (Д x В)
  • DisplayPort, HDMI и DVI

Наш рейтинг: 8,3 /10

Проверить цену на Amazon

Другим вариантом для тех из вас, кто ищет недорогую низкопрофильную видеокарту, является низкопрофильная карта Gigabyte GTX 1050 2 ГБ. Хотя GTX 1050 2 ГБ способна обеспечить достойную производительность при более низких настройках графики на мониторе 1080P, поскольку в настоящее время она продается по той же цене, что и низкопрофильная карта MSI RX 560 4 ГБ, указанная выше, вам лучше пойти с вместо этого 560.

Однако, если карта когда-либо поступит в продажу или если вы просто предпочитаете использовать карты на базе NVIDIA, то это, безусловно, жизнеспособный вариант.

Низкопрофильная карта Gigabyte GTX 1050 имеет длину 6,6 дюйма и высоту 2,7 дюйма, что соответствует другим низкопрофильным картам в этом списке.

Опять же, за эту цену вы получите больше производительности от RX 560, поэтому я бы порекомендовал пойти по этому пути, а не выбирать эту GTX 1050.

Почетное упоминание № 3:


ZOTAC GT 1030
  • Низкопрофильная видеокарта
  • 2 ГБ видеопамяти GDDR5
  • 6.8″ x 4,4″ (Д x В)
  • HDMI и DVI

Наш рейтинг: 7,9 /10

Проверить цену на Amazon

Я знаю, что мы включили в этот список множество карт Zotac, но низкопрофильная видеокарта Zotac GT 1030 2 ГБ — еще один вариант, который стоит рассмотреть всем, кто хочет создать компактный компьютер начального уровня. факторный игровой ПК.

Одна из причин, по которой мини-/низкопрофильные видеокарты Zotac широко представлены в этом списке, заключается просто в том, что они предлагают больше карт в маленьком форм-факторе, чем любой другой производитель видеокарт.И другая причина заключается в том, что среди конкурирующих вариантов Zotac предлагает эту мини-/низкопрофильную карту по гораздо более низкой цене.

Итак, если вам кажется, что мы отдаем предпочтение картам Zotac, уверяю вас, это не так! Просто с точки зрения стоимости у них, кажется, лучшие низкопрофильные и мини-видеокарты.

В любом случае, этот низкопрофильный Zotac GT 1030, вероятно, не будет иметь особого смысла для большинства сборщиков систем. Даже геймерам, которые хотят собрать игровой ПК начального уровня, лучше вообще отказаться от видеокарты (и выбрать новый APU на базе Ryzen), чем установить в свою систему GT 1030,

.

Однако, если у вас уже есть старый ПК малого форм-фактора и вам нужен дешевый низкопрофильный графический процессор, до которого вы можете перейти, чтобы продержаться до тех пор, пока вы не сможете позволить себе что-то более высококлассное, то эта карта является достойным выбором.

Ваш комментарий будет первым

Добавить комментарий

Ваш адрес email не будет опубликован.