Фотоны побеждают GPU без единого ватта. Оптические процессоры превратят свет в мгновенную вычислительную машину для ИИ

Фотоны побеждают GPU без единого ватта. Оптические процессоры превратят свет в мгновенную вычислительную машину для ИИ

Физики обещают революцию в машинном обучении через 3-5 лет.

image

Команда исследователей предложила новый способ выполнения тензорных операций, который опирается не на транзисторы, а на свойства света. В его основе — оптическая схема, где сложные вычисления выполняются за один проход луча через систему. Авторы работы считают, что такой подход способен заметно изменить, как современные ИИ-модели обрабатывают данные, и снизить нагрузку на обычное цифровое «железо».

Практически любая задача машинного обучения сейчас сводится к операциям с тензорами — многомерными массивами чисел. Графические процессоры хорошо справляются с такими вычислениями, но рост объёмов данных и размеров моделей привёл к тому, что даже мощные GPU начинают упираться в пределы по скорости, энергопотреблению и масштабируемости. На этом фоне международная группа во главе с Юйфэном Чжаном из Технологического университета Аалто стала искать альтернативу чисто электронным схемам.

Учёные предложили концепцию, которую называют «одношаговыми тензорными вычислениями» (single-shot tensor computing). Вместо того чтобы поэтапно перемножать и складывать матрицы в цифровом процессоре, исследователи используют волновую природу света. Электромагнитная волна одновременно несёт амплитуду и фазу; в работе команды эти параметры служат носителями числовой информации. Цифровые данные кодируются в набор световых сигналов, после чего пучки проходят через специально настроенную оптическую структуру и взаимодействуют между собой. В результате физические интерференционные и дифракционные процессы реализуют те же математические преобразования, которые в обычных системах выполняют блоки свёрток и слои внимания в нейросетях. Чжан подчёркивает, что операции происходят со скоростью света и не требуют привычного электронного переключения: как только луч прошёл через конфигурацию, результат уже сформирован.

Дальше группа расширила подход, добавив работу с несколькими длинами волн. Каждый спектральный компонент, по сути, превратился в отдельный вычислительный канал, что позволило выполнять более сложные, многомерные тензорные операции параллельно. Руководитель проекта сравнивает этот режим с таможенным терминалом, где каждая посылка должна пройти через множество установок с разной функцией, а затем оказаться в нужном контейнере. В обычной организации процессов груз перемещается от аппарата к аппарату; в предлагаемой аналогии все проверки и сортировка как бы спрессованы в один шаг. Исследователи говорят, что их «оптические крючки» играют в такой схеме роль связующих элементов, которые сразу сопоставляют каждый вход соответствующему выходному каналу внутри одной световой операции.

Особенность подхода в том, что взаимодействие волновых фронтов происходит пассивно, без внешнего управляющего контура. Нет контроллера, который по тактам переключает линии и задаёт последовательность действий; расчёт выполняется за счёт заранее заданной конфигурации среды, через которую проходит свет. Отсутствие активной управляющей схемы снижает энергозатраты и упрощает потенциальную интеграцию с другими компонентами. Руководитель фотонной группы университета Аалто Чжипэй Сун отмечает, что сам принцип применим на разных оптических платформах: в планах команды — перенести вычислительную схему на фотонные чипы, чтобы получить световые процессоры, способные решать задачи искусственного интеллекта при крайне низком энергопотреблении.

Авторы рассматривают перспективу практической реализации довольно оптимистично. Чжан говорит о намерении довести технологию до промышленного уровня и адаптировать её под платформы, которые разрабатывают крупные компании. Временной горизонт интеграции оценивается им в диапазоне от 3 до 5 лет. Исследователи ожидают, что по мере появления аппаратных реализаций такие системы смогут ускорять типичные ИИ-нагрузки в областях, где важна обработка данных в реальном времени.

Среди потенциальных сценариев использования - системы машинного зрения, крупные языковые модели, а также научные симуляции, требующие интенсивных тензорных вычислений. Отдельный акцент делается на энергосбережении: по мере роста параметров нейросетей и числа запросов центры обработки данных тратят всё больше электричества, и оптика обещает заметно снизить этот расход. Чжан формулирует общий вывод так: новая схема световых вычислений может стать основой поколения оптических систем, способных существенно ускорять сложные задачи искусственного интеллекта в самых разных областях, не упираясь в пределы традиционных электронных архитектур.