Апгрейд Bing: как графические процессоры Oracle помогут поисковику работать эффективнее?

Апгрейд Bing: как графические процессоры Oracle помогут поисковику работать эффективнее?

Чат-бот Microsoft стал настолько популярным, что компании не хватает вычислительных мощностей.

image

Спрос на услуги продуктов ИИ от Microsoft настолько вырос, что компания решила использовать вычислительные мощности GPU-суперкластера Oracle для улучшения своего поисковика Bing. Этот шаг стал частью масштабного соглашения между двумя технологическими гигантами, о котором представители сообщили во вторник.

Дивья Кумар, руководитель отдела маркетинга в области поисковых систем и ИИ в Microsoft, отметила, что сотрудничество с Oracle и использование их облачной инфраструктуры позволит расширить доступность нейросети и повысить скорость поисковых запросов.

Компании необходимы дополнительные ресурсы, чтобы клиенты были полностью довольны ее услугами. Oracle предлагает в аренду десятки тысяч процессоров Nvidia A100 и H100.

Microsoft стала одной из первых компаний, интегрировавших генеративного чат-бота в свой поисковой сервис. Bing Chat был запущен в феврале этого года.

Виртуальный собеседник не только оперативно предоставляет информацию по запросу, но и генерирует тексты, картинки и другой контент. Следовательно, для его стабильной работы необходимо большое количество графических процессоров (GPU) - как для первоначального обучения модели на большом объеме текстовых данных, так и для ответов в реальном времени.

Партнерство между Microsoft и Oracle подразумевает интеграцию их облачных систем. Это означает, что сервисы, размещенные на платформе Microsoft Azure, теперь могут беспрепятственно взаимодействовать с ресурсами, находящимися в инфраструктуре Oracle.

По данным StatCounter, в октябре 2023 года Bing занимал 3,1% сегмента поисковых сервисов - намного меньше, чем у Google. Речь идет о количестве запросов, обработанных за определенный промежуток времени. Показатель увеличился с предыдущего месяца: для настольных компьютеров доля Bing достигла 9,1%, для планшетов — 4,6%.

Oracle заявляет, что в будущем может масштабировать свои суперкластеры до 32 768 процессоров Nvidia A100 или 16 384 H100 GPU.

Microsoft не раскрыла, сколько узлов GPU понадобится для эффективной работы модели, и отказывается делиться деталями в будущем.

Ваш провайдер знает о вас больше, чем ваша девушка?

Присоединяйтесь и узнайте, как это остановить!