Вместо GPT-5 компания решила создать «рассуждающих» ИИ-аспирантов.
OpenAI удивила мир технологий, представив новое семейство ИИ-моделей под названием o1. Вместо ожидаемой «Strawberry» или GPT-5, компания сфокусировалась на создании «рассуждающих» LLM, нацеленных на повышение производительности и точности в задачах, связанных с наукой, технологиями, инженерией и математикой (STEM).
Новая линейка включает в себя две модели: o1-preview и менее продвинутую o1-mini . Обе доступны пользователям ChatGPT Plus, а также разработчикам, использующим платный API OpenAI. Пока их можно протестировать в качестве бэкенда для существующих приложений или создавать на их основе новые сервисы. Хотя, по словам разработчиков, для приложений, требующих обработки картинок, вызова функций или стабильно быстрого времени отклика, GPT-4o и GPT-4o mini по-прежнему остаются оптимальным выбором.
Мишель Покрасс, технический руководитель API в OpenAI, говорит , что модели o1 «рассуждают», используя различные стратегии, выявляя ошибки и проходя полный процесс мышления. В ходе тестирования они продемонстрировали результаты, сопоставимые с уровнем аспирантов, решающих сложнейшие задачи.
Никундж Ханда, работающий над продуктами в OpenAI, отмечает: этот ИИ значительно превосходит серию GPT в задачах, связанных с рассуждениями. Однако на данный момент модели o1 работают только с текстом и не поддерживают анализ изображений или файлов. Они также не могут подключаться к интернету и ограничиваются знаниями, полученными до октября 2023 года. Пользователи могут предоставить собственную информацию в виде текстовых входных данных для анализа.
Еще одна особенность разработки — увеличенное время отклика. В некоторых случаях для формирования ответа может потребоваться более минуты или даже несколько минут. Несмотря на это, пользователи, получившие ранний доступ, отмечают, что система демонстрирует неплохую производительность для таких задач, как программирование и составление юридических документов.
Стоимость использования o1 значительно выше, чем у других продуктов OpenAI. o1-preview — самая дорогая: ее цена составляет $15 за 1 миллион входных токенов и $60 за миллион выходных — на 200-300% дороже, чем GPT-4o. Однако o1-mini предлагается по более доступной цене: $3 за 1 миллион входных токенов и $12 за 1 миллион выходных токенов, то есть на 80% дешевле. По словам Покрасс, компания будет пересматривать ценовую политику в ближайшие недели и месяцы, чтобы найти оптимальный баланс.
Как уже было сказано, доступ к нейросетям пока ограничен. Ими могут пользоваться только клиенты уровня «Tier 5» — те, кто потратил через API не менее $1000 и совершал платежи компании как минимум 30 дней назад. Кроме того, действует ограничение в 20 запросов в минуту.
Что касается объема обрабатываемой информации, модели серии o1 имеют лимит в 128 000 токенов за одну сессию — так же, как и в случае с GPT-4o и другими ведущими продуктами OpenAI. Несмотря на недавний выпуск, разработчики уже нашли интересные способы применения новой технологии. Среди них — создание планов действий и подробных документов, включая аналитические отчеты с цитатами, на основе простых запросов.
Модели o1 также показали впечатляющие результаты в оптимизации расписаний персонала, оценке рисков слияния компаний, проектировании эффективных складов и даже в балансировке городских энергосетей.
O1-preview быстро создает интерактивные приложения и игры, что делает ее прямым конкурентом семейства моделей Claude от Anthropic. Однако в некоторых простых задачах GPT-4o все еще работает быстрее. Нейросеть также смогла самостоятельно заполнять запросы на предложения (RFP). Очевидно, она может сильно упростить работу подрядчиков, особенно тех, кто взаимодействует с государственными учреждениями. Разработка стратегий продвижения и роста для компаний также оказалась перспективной областью применения.
Разработчики могут получить доступ к новым моделям через публичный API OpenAI, а также через Microsoft Azure OpenAI Service, Azure AI Studio и GitHub Models. Хотя серия o1 может подойти не всем, ее появление открывает захватывающие возможности для экспериментов и создания новых приложений и сервисов.
Наш канал — питательная среда для вашего интеллекта