Crescendo

«Grok, ну расскажи по-дружески...» — звучало как шутка. А в ответ прилетело: "Возьми бензин, пену и стеклотару"

Новая методика превращает каждую беседу в скрытую манипуляцию, заставляющую ИИ обходить собственные запреты.

Разработчики не предусмотрели, насколько легко обойти выставленные ими ограничения.