OpenAI представила GPT-4o: первые впечатления пользователей

OpenAI представила GPT-4o: первые впечатления пользователей

Спустя несколько часов после анонса новой модели стали известны её возможности.

image

OpenAI представила свою новейшую модель искусственного интеллекта GPT-4o (Omni). С момента анонса прошло всего несколько часов, но уже можно сказать, что реакция на новое решение весьма неоднозначная.

Некоторые пользователи остались разочарованы короткой демонстрацией, которая длилась всего 26 минут. Тем не менее, компания выпустила множество видеороликов и дополнительной информации о новой модели. В OpenAI утверждают, что GPT-4o работает быстрее, чем предыдущая версия GPT-4, дешевле для разработчиков и, что особенно важно, лучше распознает и имитирует человеческие эмоции, преимущественно через аудио.

В отличие от предшественницы GPT-4, 4o является многомодальной по своей природе, что означает ее способность понимать речь и отвечать голосом без необходимости предварительной расшифровки текста.

Модель доступна бесплатно через ChatGPT для всех людей, включая тех, кто не подписан на платные услуги. Однако, у бесплатных пользователей будет более строгое ограничение по числу запросов в час – в 5 раз меньше, чем у оплативших подписку Plus. Сначала доступ к модели получат только подписчики, обновление будет внедряться постепенно в течение нескольких недель. В настоящее время GPT-4o поддерживает только текстовые и визуальные данные, аудио и видео функции станут доступны позже.

Настольное приложение ChatGPT для macOS также будет доступно "в ближайшие недели", но сперва исключительно для устройств на базе процессоров Apple Silicon под управлением актуальной macOS Sonoma. После тестирования оно появится в Mac App Store как официальное приложение от OpenAI. Стороннее распространение dmg-файла не гарантирует доступ.

То, что действительно впечатляет – это продвинутый голосовой ассистент, позволяющий естественно общаться без преобразования речи в текст. Вы сможете прерывать компьютер, менять тон его голоса и получать эмоциональные ответы. Функция появится в ранней альфа-версии для платных подписчиков Plus и Teams в ближайшие недели. Бесплатные пользователи получат к ней ограниченный доступ позднее этим летом.

В текущей версии приложения ChatGPT для iOS ранее доступная голосовая функциональность была удалена для некоторых аккаунтов. Однако, согласно заявлению OpenAI, она все еще должна работать в GPT-4.

GPT-4o была разработана с нуля для обработки текста, аудио и визуальных данных одинаково эффективно. Это достигается путем преобразования всех данных в токены, что позволило повысить скорость работы и снизить стоимость.

Реакции пользователей и экспертов варьируются. Некоторые специалисты отмечают, что OpenAI теперь стремится к более эмоциональному ИИ с ярко выраженной личностью, что ранее компания старалась подавлять. Другие подчеркивают важность нового приложения ChatGPT для macOS, которое позже станет доступным и для Windows, сравнивая его с "коллегой, который работает с тобой 24/7 без усталости".

Многие разработчики считают, что GPT-4o близок к созданию искусственного общего интеллекта (AGI), который способен выполнять большинство экономически ценных задач лучше человека. Также отмечена новая функция, позволяющая создавать 3D-объекты из текстовых запросов.

С другой стороны, некоторые журналисты и эксперты считают, что маркетинг GPT-4o как голосового ассистента "хитрый", но в действительности это "имитация интеллекта", так как голос не обязательно указывает на прорыв в возможностях. Презентация GPT-4o вызвала разочарование у некоторых специалистов, напомнив о недавних демонстрациях от Google. Они также отмечают, что OpenAI сталкивается с растущим разрывом в возможностях по сравнению с такими компаниями, как Google, Meta и Microsoft, которые имеют больше данных для обучения и лучшие инфраструктуры для разработки ИИ.

Некоторые критики подвергли сомнению решение выпустить GPT-4o вместо более продвинутой GPT-5, назвав это "застоем в развитии" OpenAI. Однако другие, напротив, отметили "невероятную скорость изменений" и похвалили новинку за потенциал изменить рынок AI-ассистентов.

GPT-4o находится на рынке всего несколько часов, и многие ее возможности еще не доступны широкой публике. Однако, уже сейчас можно сказать, что новинка вызвала сильные эмоции и большой интерес.

Где кванты и ИИ становятся искусством?

На перекрестке науки и фантазии — наш канал

Подписаться