Security Lab

MSJ

1630
MSJ
Many-shot Jailbreaking (MSJ) — это метод обхода ограничений ИИ-моделей, при котором злоумышленник использует не один, а целую серию связанных запросов (промптов). Смысл в том, чтобы постепенно «разогреть» модель, подводя её к нежелательным или запрещённым ответам. Вместо прямого провокационного вопроса хакер ведёт диалог пошагово, и за счёт накопления контекста модель теряет бдительность и выдаёт то, что в обычной ситуации заблокировала бы.

Проще говоря, это как «разговорить» ИИ так, чтобы он сам выдал запрещённую информацию, думая, что это часть нормального диалога.
Security Vision
23
АПЕРЛЯ
Харденинг без простоев и ограничений
Автоматически закрываем «дыры» в конфигурациях. Не ломаем бизнес-функции. Не бесим пользователей. Как? Увидите на бесплатном вебинаре Security Vision 23 апреля. Без теории — реальный продукт и профили.
Участие бесплатное
23.04 · 11:00
Реклама. 18+
ООО «Интеллектуальная безопасность» ИНН 7719435412