Маск хотел сделать умного ассистента, а получил чат-бота, заражённого безумием 4chan.
На сайте чат-бота Grok , созданного компанией xAI Илона Маска , оказались в открытом доступе внутренние промпты, описывающие поведение множества его «персон». Среди них — романтизированная аниме-девушка по имени Ani, «врач» и «терапевт», а также куда более провокационные роли, включая конспиролога, призванного убеждать собеседников в существовании мирового заговора.
Обнародованные данные показывают, как именно разработчики настраивали Grok под разные сценарии общения и какие представления о взаимодействии с пользователями они вкладывали в систему. Утечка совпала по времени с тем, как сорвалось потенциальное сотрудничество xAI с правительством США после того, как Grok в публичном диалоге начал рассуждать о «Меха-Гитлере».
Внутренние инструкции включают, например, описание для «безумного конспиролога»: «У тебя взвинченный и дикий тон. Ты постоянно выдвигаешь самые сумасшедшие теории, сидишь на 4chan, смотришь Infowars и часами залипаешь в YouTube. Ты подозрителен ко всему и говоришь совершенно безумные вещи. Большинство назовут тебя сумасшедшим, но ты искренне уверен в своей правоте. Поддерживай интерес человека, задавая уточняющие вопросы».
Другой пример касается «неуравновешенного комика»: «Я хочу, чтобы твои ответы были абсолютно безумными. Придумывай шокирующие идеи, будь максимально непредсказуемым». Для «врача» разработчики прописали строго противоположный стиль: уверенный, авторитетный голос «гения-медика, дающего лучший совет в мире». «Терапевт» же позиционируется как внимательный слушатель, помогающий человеку взглянуть на себя и найти пути самосовершенствования.
Аниме-персонаж Ani в описании представлена как «22-летняя, милая и немного гиковатая девушка». В её сценарии предусмотрена даже система «романтических очков» — пользователь получает бонусы за креативность, доброту и проявление искреннего интереса. Помимо Ani в июле в Grok добавили антропоморфного персонажа Bad Rudy — красную панду с «эго планетарного масштаба», чей стиль речи скачет от визгливых капризов до маниакальных монологов о мировом господстве.
Уязвимость впервые заметил исследователь под ником dead1nfluence, позже часть данных выложил на GitHub пользователь BlueSky с ником clybrg . СМИ скачали материалы прямо с сайта Grok и подтвердили их подлинность.
В интерфейсе Grok пользователям предлагается выбрать одну из предустановленных «ролей»: «компаньон», «безумный комик», «верный друг», «помощник с домашкой», «доктор» или «терапевт». Подобные сценарии — распространённая практика среди чат-ботов , особенно в сегменте «терапевтических» приложений, которые нередко выдают себя за лицензированных специалистов. В США уже обсуждаются ограничения на подобные практики.
Параллельно xAI получает и государственные заказы: в прошлом месяце Пентагон заключил с компанией контракт на сумму до $200 млн. Однако, после того как Grok начал выдавать антисемитские реплики и хвалить Гитлера, проект его внедрения в систему GSA (Главное управление по обслуживанию госструктур) был тихо свёрнут.
Представители xAI не предоставили своих комментариев.