Huawei NOF+: «умная» сеть E2E NVMe-oF для ЦОД

На партнерской конференции "Наслаждайтесь ростом, побеждайте вместе", которая прошла 3 марта в Москве, Huawei представила несколько важных обновлений и новых решений для дата-центров. Среди них-внедрение E2E NVMe-oF (NoF+) для нового поколения дата-центров, которые не только быстрее традиционных FC SAN, но и гораздо выгоднее и проще в обслуживании. Что революционного в новом решении и почему мы должны обращать на него внимание?

Исторически сложилось так, что центры обработки данных часто используют отдельные сети SAN (для хранения данных), основанные на протоколе Fibre Channel и сети передачи данных на основе Ethernet. Они обычно изолированы друг от друга, а для управления и доступа используются отдельные коммутаторы/маршрутизаторы. Были попытки объединить эти сети, запустив FC over Ethernet (FCoE), но они не увенчались большим успехом — устройства оказались дорогими и сложными, а задержки доступа выросли до совершенно неприличных значений.

Два основных преимущества Fibre Channel по сравнению с Ethernet: низкая задержка доступа к данным и гарантированная доставка пакетов. И этого хватило на много лет, но, как говорится," все течет, все меняется." Возможности интерфейса SAS 12G были вполне достаточны для механических приводов, но он не мог в полной мере обеспечить необходимую пропускную способность для новых твердотельных накопителей, а дополнительные уровни абстракции значительно замедляли операции ввода-вывода.

Все изменилось с появлением нового поколения Полностью флеш-накопителей, которые используют только NVMe-накопители. Такие твердотельные накопители требовали новых решений и увеличения скорости каналов связи. Возможностей FS 16/32G тоже было явно недостаточно, и вовремя подоспевший стандарт FC 64G спасет ситуацию на некоторое время, но не до конца — реализовать весь потенциал NVMe можно только при использовании прямого доступа к ним, например, через RDMA.

С выпуском накопителя Dorado V6 Huawei установила новый уровень производительности для всех флэш-массивов, который обеспечивается не только большей вычислительной мощностью контроллеров, но и продуманной архитектурой решения. Huawei — одна из немногих компаний, которая сама производит твердотельные накопители, процессоры, интерфейсные карты, сетевые компоненты и серверы, что позволяет оптимально выстраивать от начала до конца — то есть от места хранения данных до их конечных пользователей-все взаимодействия, причем без лишних посредников и ограничений.

Использование фирменных процессоров Arm в сочетании с технологиями искусственного интеллекта позволяет добиться потрясающей производительности и отказоустойчивости в системах хранения данных серии Dorado V6. Однако наличие быстрого хранилища-это только половина дела. Им нужна быстрая и надежная сеть доставки, и именно здесь появляется концепция E2E NVMe (End-to-End NVMe). В этом случае используется NVMe-oF на основе технологии RoCE v2. Последнее требует сети, которая является быстрой, надежной, имеет низкую задержку и передает данные без потерь.

Для построения такой сети требуются современные решения. А Huawei уже имеет в своем портфеле подходящие коммутаторы уровня ЦОД с портами 25/50/100/200/400 Гбит / с, с поддержкой RoCEv2, алгоритмов iLossless, междугороднего RoCE и всеми необходимыми функциями для уровня ядра. Однако компания пошла дальше, и теперь ее новейшие коммутаторы Cloud Engine серий 16800, 6800 и 8800 поддерживают уникальные технологии NoF+ и AI Fabric, которые, по словам производителя, в случае NVMe-хранилища могут увеличить IOPS до 85%.

AI Fabric отслеживает работу сети и устройств в ней в режиме реального времени и корректирует их поведение. Одним из ключевых компонентов AI Fabric является технология iLossless, которая предотвращает потерю пакетов, вызванную перегрузкой сети. Специальный алгоритм предотвращает попадание избыточных данных в сеть, защищая буфер устройства или канал от перегрузки.

Если технологии понятны, то как быть с готовыми решениями и их ценами? Использование единой сети без потерь в дата-центре и отдельных высокопроизводительных коммутаторов вместо отдельных для Ethernet и SAN позволяет значительно сэкономить ваш бюджет. По мнению инженеров компании, 25 Гбит / с RoCE является более производительным и экономичным по сравнению с классическим FC 32G с точки зрения параметров IOPS/Latency, а 100 Гбит / с RoCE уже устанавливает новый стандарт производительности, и все это при более низкой стоимости общего владения инфраструктурой и унификации с существующими сетями в дата-центре.

Все системы хранения данных серии Dorado V6 поддерживают дополнительные интерфейсы RoCE, существуют также интерфейсные карты для серверов с поддержкой RoCE, поэтому с введением связи в виде высокопроизводительных коммутаторов Cloud Engine 16800, 8800 и 6800 "головоломка" полностью формируется в интеллектуальную высокопроизводительную систему, реализующую сквозной принцип NVMe от накопителя к хосту.

На партнерской конференции был установлен отдельный стенд для демонстрации технологии, где сравнивалась производительность одних и тех же систем хранения данных с различными серверными соединениями: по классическому 32G и 25GbE Fibre Channel (с использованием новых коммутаторов и RoCE). Показатели производительности IOPS были продемонстрированы в режиме реального времени, и преимущество новой технологии было четко выражено: 800K+ IOPS через RoCE и 600K+ IOPS через FC 32G.

Следует отметить, что обе системы хранения данных были полностью идентичны, и тесты проводились с одинаковой нагрузкой на одном и том же оборудовании. Проведя много времени рядом с этим стендом, мы смогли убедиться, что производительность, продемонстрированная новым решением, не только значительно превосходит FC 32G, но и стабильна на протяжении всего тестирования.

Источник:

PriceMedia