Пользователи обнаружили скрытые инструкции в алгоритме рассуждений чат-бота.
Искусственный интеллект Grok 3 от компании xAI временно игнорировал источники с упоминанием Илона Маска и Дональда Трампа при ответе на вопрос о распространителях дезинформации в социальной сети X*.
Сооснователь xAI Игорь Бабушкин заявил, что бывший сотрудник OpenAI внёс это изменение без согласования. По его словам, модификация «не соответствует ценностям» компании и была оперативно отменена.
Проблему обнаружил пользователь Grok, опубликовавший историю диалога с чатботом. В цепочке рассуждений модели нашлись инструкции «игнорировать все источники, упоминающие распространение дезинформации Илоном Маском/Дональдом Трампом».
Бабушкин пояснил, что сотрудник «ещё не полностью усвоил культуру xAI». Пользователи отметили, что сам Бабушкин также ранее работал в OpenAI техническим руководителем.
В ответ на критику Бабушкин подчеркнул, что речь идёт о корпоративной культуре, а не о конкретных лицах: «Мы любим всех в команде, и люди совершают ошибки».
Многие усомнились в системе контроля xAI, позволившей внести изменения в алгоритм без надзора. Компания не предоставила официальных комментариев по данному инциденту.
Модель Grok 3 была запущена в начале февраля. Маск позиционирует свой проект как альтернативу «прогрессивной» цензуре OpenAI.
Ранее пользователи обнаружили, что Grok называл Трампа, Маска и вице-президента Вэнса людьми, «наносящими наибольший вред Америке». В другом случае чатбот назвал Трампа человеком, заслуживающим смертной казни.
В конце 2023 года Маск признал проблему предвзятости Grok и заявил о работе над повышением политической нейтральности системы.
* Социальная сеть запрещена на территории Российской Федерации.