Чат-бот Microsoft стал настолько популярным, что компании не хватает вычислительных мощностей.
Спрос на услуги продуктов ИИ от Microsoft настолько вырос, что компания решила использовать вычислительные мощности GPU-суперкластера Oracle для улучшения своего поисковика Bing. Этот шаг стал частью масштабного соглашения между двумя технологическими гигантами, о котором представители сообщили во вторник.
Дивья Кумар, руководитель отдела маркетинга в области поисковых систем и ИИ в Microsoft, отметила, что сотрудничество с Oracle и использование их облачной инфраструктуры позволит расширить доступность нейросети и повысить скорость поисковых запросов.
Компании необходимы дополнительные ресурсы, чтобы клиенты были полностью довольны ее услугами. Oracle предлагает в аренду десятки тысяч процессоров Nvidia A100 и H100.
Microsoft стала одной из первых компаний, интегрировавших генеративного чат-бота в свой поисковой сервис. Bing Chat был запущен в феврале этого года.
Виртуальный собеседник не только оперативно предоставляет информацию по запросу, но и генерирует тексты, картинки и другой контент. Следовательно, для его стабильной работы необходимо большое количество графических процессоров (GPU) - как для первоначального обучения модели на большом объеме текстовых данных, так и для ответов в реальном времени.
Партнерство между Microsoft и Oracle подразумевает интеграцию их облачных систем. Это означает, что сервисы, размещенные на платформе Microsoft Azure, теперь могут беспрепятственно взаимодействовать с ресурсами, находящимися в инфраструктуре Oracle.
По данным StatCounter, в октябре 2023 года Bing занимал 3,1% сегмента поисковых сервисов - намного меньше, чем у Google. Речь идет о количестве запросов, обработанных за определенный промежуток времени. Показатель увеличился с предыдущего месяца: для настольных компьютеров доля Bing достигла 9,1%, для планшетов — 4,6%.
Oracle заявляет, что в будущем может масштабировать свои суперкластеры до 32 768 процессоров Nvidia A100 или 16 384 H100 GPU.
Microsoft не раскрыла, сколько узлов GPU понадобится для эффективной работы модели, и отказывается делиться деталями в будущем.
Наш канал — питательная среда для вашего интеллекта