То, что раньше звучало как скрипт, теперь ощущается как разговор с живым собеседником.
Компания ElevenLabs, известная своими передовыми решениями в области синтеза речи и звуковых эффектов на базе ИИ, анонсировала масштабное обновление своей платформы — Conversational AI 2.0. Разработанная бывшими инженерами Palantir, новая версия делает шаг вперёд в создании максимально естественных и интеллектуальных голосовых агентов для бизнеса, начиная от поддержки клиентов до автоматизации продаж и маркетинга.
Вторая версия Conversational AI теперь умеет работать с теми нюансами, которые отличают живой диалог от роботизированных голосовых сервисов. Благодаря новой системе управления очерёдностью реплик, агент учится реагировать на паузы, интонационные особенности и не перебивать собеседника, а также адекватно использовать паузы и заполнители, что полностью убирает ощущение механического общения. Эта функция особенно востребована в службах поддержки и колл-центрах, где важна скорость реакции при сохранении комфорта для клиента.
Важным нововведением стала автоматическая языковая идентификация: теперь агент сам определяет язык пользователя и моментально переключается без необходимости настраивать параметры вручную. Такая функция уже становится стандартом для глобальных компаний, работающих с многоязычной аудиторией, и помогает убрать языковые барьеры для клиентов по всему миру.
Новая система также включает Retrieval-Augmented Generation (RAG) — возможность на лету получать информацию из внешних баз знаний. Например, медицинский голосовой ассистент сможет моментально обращаться к актуальным клиническим рекомендациям, а служба поддержки — к внутренней документации по продуктам. Всё это реализовано с минимальными задержками и повышенными гарантиями конфиденциальности, что критично для регулируемых сфер вроде медицины.
Один из ключевых аспектов платформы — поддержка мультимодальности. Теперь агент может взаимодействовать не только голосом, но и текстом, а также комбинировать оба канала без необходимости создавать разные версии под каждую платформу. Вдобавок, внедрён режим «Multi-Character»: голосовой ассистент может менять роль и стиль общения, имитируя разные образы, что открывает возможности для креатива, образовательных программ и тренинговых сценариев.
Для компаний, работающих с массовыми коммуникациями, реализована функция пакетных исходящих звонков: теперь платформа позволяет автоматически запускать параллельные обзвоны, что удобно для проведения опросов, отправки уведомлений или персонализированных сообщений. Это ощутимо повышает охват аудитории и снижает нагрузку на операторов.
Разработчики ElevenLabs уделили отдельное внимание требованиям безопасности и соответствию стандартам: новая платформа соответствует требованиям HIPAA для медицинских данных и поддерживает опциональное хранение информации в ЕС, что важно для корпоративных клиентов с жёсткими регуляторными ограничениями. Система рассчитана на высокую доступность, легко интегрируется с внешними сервисами и подходит для работы в критически важных инфраструктурах.
Платформа доступна по нескольким тарифам — от бесплатного уровня с базовым набором минут и ограничением на одновременные соединения, до бизнес-плана с расширенным пакетом услуг и поддержкой тысяч минут в месяц. Такой подход делает продукт доступным как для стартапов, так и для крупных корпоративных заказчиков.
Релиз Conversational AI 2.0 знаменует новый виток в развитии голосовых технологий для бизнеса: ElevenLabs делает ставку на максимальную естественность, адаптивность и масштабируемость своих решений, подчёркивая, что эра реалистичных цифровых собеседников только начинается.