ИИ из света: более энергоэффективный и производительный ИИ при помощи оптики

ИИ из света: более энергоэффективный и производительный ИИ при помощи оптики

Исследование показало, как нелинейная оптика может улучшить классификацию изображений.

image

Современные модели искусственного интеллекта (ИИ), использующие миллиарды обучаемых параметров, сталкиваются с проблемой огромных затрат на обучение и развертывание. Модели требуют значительного объема памяти и вычислительных мощностей, доступных только в огромных дата-центрах, потребляющих электроэнергию, сравнимую с потребностями целых городов.

Исследовательское сообщество активно ищет способы оптимизации как вычислительного оборудования, так и алгоритмов машинного обучения для поддержания темпов развития ИИ. Одним из перспективных направлений является оптическая реализация архитектур нейронных сетей, что позволяет существенно снизить потребление энергии.

В новом исследовании, опубликованном в журнале Advanced Photonics, демонстрируется использование распространения света в многомодовых волокнах (multimode fiber, MMF) с небольшим числом программируемых параметров для достижения такой же эффективности в задачах классификации изображений, как у полностью цифровых систем в более чем 100 раз большим числом параметров. Такой подход сокращает требования к памяти и уменьшает необходимость в энергоемких вычислительных процессах, сохраняя при этом высокую точность в различных задачах машинного обучения.

Схема эксперимента по программированию оптического распространения для вычислительной задачи.

Пространственный модулятор света (spatial light modulator, SLM) модулирует лазерные импульсы с помощью образца данных, наложенного на фиксированный шаблон программирования. Пучок соединен с многомодовым волокном. Узор после распространения фиксируется камерой. Обучаемый уровень классификации выходных данных вычисляет точность задачи, которая передается обратно в суррогатный алгоритм оптимизации. Алгоритм повышает производительность задачи, исследуя различные параметры программирования и уточняя потенциальные решения.

Основой работы является точный контроль сверхкоротких импульсов в многомодовых волокнах с помощью техники формирования волнового фронта. Такой метод позволяет осуществлять нелинейные оптические вычисления с использованием микроватт средней оптической мощности, что является важным шагом в реализации потенциала оптических нейронных сетей.

Ученые обнаружили, что с помощью небольшой группы параметров можно выбрать определенный набор весов модели из 'банка весов' (Weight Bank), который предоставляет оптика, и использовать его для решения вычислительных задач. Таким образом, мы используем естественные явления в качестве вычислительного оборудования, избегая затрат на производство и эксплуатацию специализированных устройств.

Результаты исследования представляют собой значительный шаг в решении проблем, связанных с растущим спросом на более крупные модели машинного обучения. Ученые открыли путь к созданию энергоэффективных и высокопроизводительных аппаратных решений в сфере ИИ, используя вычислительные возможности распространения света в многомодовых волокнах.

Как показано в эксперименте с нелинейной оптикой, данный вычислительный подход также может быть использован для эффективного программирования различных многомерных нелинейных явлений для выполнения задач машинного обучения, а также для преобразования ресурсоемкой природы существующих моделей искусственного интеллекта.

Домашний Wi-Fi – ваша крепость или картонный домик?

Узнайте, как построить неприступную стену