SC20: AMD Instinct MI100 — самый быстрый PCIe-ускоритель на базе новой архитектуры CDNA

16.11.2020 - Просмотров: 33

AMD Instinct MI100 — первая газовая педаль, основанная на 7-нм архитектуре CDNA, которая, в отличие от RDNA, ориентирована на вычисления, а не на графику, хотя и сохраняет некоторые компоненты для рендеринга. Однако, пути RDNA и CDNA наконец-то разошлись, и новая педаль газа предназначена исключительно для высокопроизводительных вычислений и ИИ.

Первая из серии MI100 имеет 120 CU, которая содержит новые блоки для матричных операций, которые важны для рабочих нагрузок ИИ. Но они работают без ущерба для "классических" вычислений, с пиковой производительностью FP64 в 11,5 Тфлопс и FP32 в два раза выше, чем у 23 Тфлопс. Эти цифры выше, чем у NVIDIA A100, и AMD настаивает на том, что это прирост производительности, необходимый для достижения желанной производительности одного экзафлопа.

Однако, на другом конце спектра, в расчетах bfloat16, новинка от AMD проигрывает — 92.3 Тфлоп против 312 Тфлоп на тензорном ядре. Другие заданные значения производительности для других показателей точности расчета варьируются. Кроме того, PCI-версия A100 может быть несколько медленнее SXM-версии из-за более низкого энергопотребления на реальных задачах. А Instinct MI100 пока доступен только в форм-факторе полноразмерной PCIe-карты с потреблением 300 Вт.

Карта имеет 32 ГБ памяти HBM2 с пропускной способностью 1.23 ТБ/с, что немного меньше, чем у PCIe версии NVIDIA A100:40 ГБ HBM2e и 1.555 ТБ/с соответственно. Обе карты имеют основной интерфейс PCIe 4.0 x16 (64 Гбайта/с) и дополнительную шину для прямой связи между педалями газа. В случае NVIDIA это NVLink (600 Гбайт/с), который для версии PCIe ограничен только двумя платами, а в случае AMD — Infinity Fabric (IF).

MI100 имеет три ПЧ интерфейса с полосой пропускания 92 Гбайт/с (всего 276 Гбайт/с), что позволяет объединять до четырех педалей газа, которые могут взаимодействовать друг с другом по схеме. Это не зависит от того, подключен ли интерфейс PCIe 3.0 или 4.0 к хосту. Естественно, лучшим вариантом для системы в целом будет кучка AMD EPYC и новая MI100.

Основным козырем драмов, как это часто бывало раньше, является стоимость новых продуктов. Компания не дает точных цен, но говорит, что производительность за доллар в 1.8-2.1 раза выше, чем у NVIDIA A100. Среди первых систем, для которых производится аттестация новых педалей газа, — Dell PowerEdge R7525, Gigabyte G482-Z54, HPE Apollo 6500 Gen10 Plus, Supermicro AS-4124GS-TNR. Избранные партнеры уже получили новые педали газа и системы на их основе для оценки производительности и адаптации программного обеспечения.

Вместе с выпуском Instinct MI100 компания AMD представила новый основной релиз ROCm 4.0, открытой программной платформы для HPC и AI. AMD подчеркивает повышение производительности, простоту использования и готовность многих программных решений к работе с новой версией и новым утюгом. И главное — это простота переноса кода на новую платформу, в первую очередь с NVIDIA CUDA. Для некоторых разработчиков это заняло буквально от нескольких часов до одного дня, а в более сложных случаях — до нескольких недель.

Новая программно-аппаратная платформа на базе AMD EPYC, Instinct M100 и ROCm 4.0 станет основой для будущих суперкомпьютеров Frontier и Pawsey. А окажутся ли новые машины с МИ100 в последнем рейтинге TOP500, который мы узнаем завтра. Конкурс будет проводиться за новые педали газа NVIDIA A100 с удвоенным объемом памяти HBM2e.

Источник:

Читайте также