На недавней конференции GTC в Сан-Хосе компания Nvidia представила инновационный оптический сетевой коммутатор, который обещает существенно снизить энергопотребление дата-центров, поддерживающих системы искусственного интеллекта. Устройство использует технологию совмещенной оптики (co-packaged optics, CPO), которая позволяет передавать десятки терабит данных в секунду между серверными стойками.
Кроме того, компания Micas Networks анонсировала запуск серийного производства аналогичного устройства на базе технологии Broadcom. Рынок оптических решений переживает значительные изменения, так как текущая инфраструктура не справляется с возрастающими потребностями вычислительных систем.
Сегодня сетевое оборудование в дата-центрах основано на специализированных чипах, которые соединяются с оптическими приемопередатчиками с помощью электрических соединений. Эти модули включают лазеры, оптические схемы и процессоры для обработки сигналов, которые преобразуют электрические биты в фотоны, передающиеся по оптоволоконным каналам.
В современных дата-центрах подключаемая оптика потребляет около 10% от общей мощности GPU-вычислений. При использовании 400 000 графических ускорителей энергозатраты достигают 40 мегаватт, при этом более половины этой энергии уходит только на питание лазеров в модулях связи.
Технология CPO решает эту проблему, максимально приближая преобразование сигналов к основному чипу. Современные методы компоновки позволяют окружить чип кремниевыми оптическими элементами, а оптоволокно подключается напрямую к корпусу. Это приводит к значительному сокращению количества необходимых лазеров (в четыре раза), улучшению эффективности передачи информации (в 3,5 раза), увеличению стабильности сигналов между машинами (в 63 раза) и повышению устойчивости к сбоям (в 10 раз). Также время развертывания оборудования сокращается на 30%.
В рамках нового релиза Nvidia анонсировала две модели — Spectrum-X и Quantum-X. Quantum-X, которая будет выпущена в этом году, будет работать на технологии InfiniBand, оптимизированной для высокопроизводительных задач. Каждый из 144 портов сможет передавать 800 гигабит в секунду, а два ключевых элемента системы будут охлаждаться жидкостью, а не воздухом.
Встроенная технология SHARP FP8 разгружает основные процессоры, перенаправляя часть операций на сетевой компонент. Ethernet-модель Spectrum-X обеспечит пропускную способность около 100 терабит в секунду через 128 или 512 каналов, а старшая версия будет справляться с 400 терабитами через 512 или 2048 выходов.
В своей разработке Nvidia использовала модуляторы на основе микрокольцевого резонатора, заменив традиционную схему Маха-Цендера. В классической схеме световой поток делится на две параллельные части, которые изменяются под воздействием электрического поля и при объединении гасят или усиливают друг друга, формируя итоговый сигнал. Микрокольцевое решение компактнее, но требует встроенных нагревателей из-за чувствительности к температуре. Это решение позволяет уменьшить размер устройства и снизить потери света, обеспечивая более точную фильтрацию нужных длин волн.
В конструкции Quantum-X используется по 18 кремниевых фотонных элементов в каждом из двух основных блоков, которые подключаются к паре лазеров и 16 волокнам. Для обеспечения надежности системы инженерам пришлось разработать новые методы тестирования.
Разработка Micas Networks уже запущена в производство и использует технологию Broadcom Bailly с единым функциональным блоком. Вокруг центрального чипа Tomahawk 5 расположены восемь оптических модулей, каждый из которых обрабатывает поток в 6,4 терабита в секунду. В отличие от решения Nvidia, здесь применяется воздушное охлаждение.
Новая система потребляет на 40% меньше энергии по сравнению с традиционными подходами. Более простая схема прохождения сигнала также повышает надежность, снижая количество кратковременных разрывов соединений.
Кремниевые модуляторы в оптических блоках Nvidia функционируют на скорости 200 гигабит в секунду, но в будущем планируется увеличить этот показатель до 400 гигабит. Для дальнейшего увеличения скорости потребуется интеграция новых материалов, таких как ниобат лития и фосфид индия.
Пока ведущие компании совершенствуют магистральные каналы, стартапы, такие как Avicena, Ayar Labs и Lightmatter, работают над оптическими соединениями на уровне процессоров. Avicena и Ayar Labs создали специализированные компоненты для размещения рядом с вычислительными ядрами, а Lightmatter планирует использовать фотонный модуль как основу для трехмерной компоновки будущих микросхем. Время покажет, как будет развиваться этот рынок, и надеемся, что нас ждет светлое будущее с новыми достижениями в области оптических технологий.
Кроме того, компания Micas Networks анонсировала запуск серийного производства аналогичного устройства на базе технологии Broadcom. Рынок оптических решений переживает значительные изменения, так как текущая инфраструктура не справляется с возрастающими потребностями вычислительных систем.
Сегодня сетевое оборудование в дата-центрах основано на специализированных чипах, которые соединяются с оптическими приемопередатчиками с помощью электрических соединений. Эти модули включают лазеры, оптические схемы и процессоры для обработки сигналов, которые преобразуют электрические биты в фотоны, передающиеся по оптоволоконным каналам.
В современных дата-центрах подключаемая оптика потребляет около 10% от общей мощности GPU-вычислений. При использовании 400 000 графических ускорителей энергозатраты достигают 40 мегаватт, при этом более половины этой энергии уходит только на питание лазеров в модулях связи.
Технология CPO решает эту проблему, максимально приближая преобразование сигналов к основному чипу. Современные методы компоновки позволяют окружить чип кремниевыми оптическими элементами, а оптоволокно подключается напрямую к корпусу. Это приводит к значительному сокращению количества необходимых лазеров (в четыре раза), улучшению эффективности передачи информации (в 3,5 раза), увеличению стабильности сигналов между машинами (в 63 раза) и повышению устойчивости к сбоям (в 10 раз). Также время развертывания оборудования сокращается на 30%.
В рамках нового релиза Nvidia анонсировала две модели — Spectrum-X и Quantum-X. Quantum-X, которая будет выпущена в этом году, будет работать на технологии InfiniBand, оптимизированной для высокопроизводительных задач. Каждый из 144 портов сможет передавать 800 гигабит в секунду, а два ключевых элемента системы будут охлаждаться жидкостью, а не воздухом.
Встроенная технология SHARP FP8 разгружает основные процессоры, перенаправляя часть операций на сетевой компонент. Ethernet-модель Spectrum-X обеспечит пропускную способность около 100 терабит в секунду через 128 или 512 каналов, а старшая версия будет справляться с 400 терабитами через 512 или 2048 выходов.
В своей разработке Nvidia использовала модуляторы на основе микрокольцевого резонатора, заменив традиционную схему Маха-Цендера. В классической схеме световой поток делится на две параллельные части, которые изменяются под воздействием электрического поля и при объединении гасят или усиливают друг друга, формируя итоговый сигнал. Микрокольцевое решение компактнее, но требует встроенных нагревателей из-за чувствительности к температуре. Это решение позволяет уменьшить размер устройства и снизить потери света, обеспечивая более точную фильтрацию нужных длин волн.
В конструкции Quantum-X используется по 18 кремниевых фотонных элементов в каждом из двух основных блоков, которые подключаются к паре лазеров и 16 волокнам. Для обеспечения надежности системы инженерам пришлось разработать новые методы тестирования.
Разработка Micas Networks уже запущена в производство и использует технологию Broadcom Bailly с единым функциональным блоком. Вокруг центрального чипа Tomahawk 5 расположены восемь оптических модулей, каждый из которых обрабатывает поток в 6,4 терабита в секунду. В отличие от решения Nvidia, здесь применяется воздушное охлаждение.
Новая система потребляет на 40% меньше энергии по сравнению с традиционными подходами. Более простая схема прохождения сигнала также повышает надежность, снижая количество кратковременных разрывов соединений.
Кремниевые модуляторы в оптических блоках Nvidia функционируют на скорости 200 гигабит в секунду, но в будущем планируется увеличить этот показатель до 400 гигабит. Для дальнейшего увеличения скорости потребуется интеграция новых материалов, таких как ниобат лития и фосфид индия.
Пока ведущие компании совершенствуют магистральные каналы, стартапы, такие как Avicena, Ayar Labs и Lightmatter, работают над оптическими соединениями на уровне процессоров. Avicena и Ayar Labs создали специализированные компоненты для размещения рядом с вычислительными ядрами, а Lightmatter планирует использовать фотонный модуль как основу для трехмерной компоновки будущих микросхем. Время покажет, как будет развиваться этот рынок, и надеемся, что нас ждет светлое будущее с новыми достижениями в области оптических технологий.