Prompt Injection

Уязвимость типа Prompt Injection заключается в манипуляции входными данными так, чтобы заставить систему (например, ИИ-модель или чат-бота) выполнить нежелательные или вредоносные действия. Злоумышленник вводит специальные команды или текст, который интерпретируется системой как инструкция, а не как обычный ввод пользователя. Это может привести к утечке конфиденциальной информации, выполнению несанкционированных операций или другим неблагоприятным последствиям.

Десятки тысяч уязвимостей, но опасна лишь одна. Узнайте на бесплатном вебинаре Security Vision 30 июля, как видеть всю инфраструктуру, верно расставлять приоритеты и не срывать SLA.

Участие бесплатное

18+. Реклама. Рекламодатель ООО «Интеллектуальная безопасность», ИНН 7719435412

11 июля, 2026

Нейросеть придумала ссылку, а хакеры уже ждут, пока вы по ней перейдёте. Разбор атаки HalluSquatting

Обычная «галлюцинация» оказалась слишком удобной для чужого замысла.

2 июля, 2026

"2+2=5" — правильный ответ. У Оруэлла это была пытка, у ИИ-браузеров — настройка по умолчанию

Метод BioShocking показал, как манипуляция контекстом ломает привычные запреты.

1 июля, 2026

Синтез кокаина разрешён, потому что рубашка зелёная. Исследователи нашли слабое место всех умных алгоритмов

Защиту языковых моделей пробили обычной стилизацией текста.

8 июня, 2026

Lockdown Mode добрался и до ChatGPT. OpenAI «кастрировала» свой ИИ для повышения безопасности

Новый режим превращает некогда умного помощника в обыкновенного параноика.

5 июня, 2026

Одного сообщения в WhatsApp хватит, чтобы взломать вас. И даже отвечать на него вам не нужно

Разбор свежей атаки на Android-смартфоны через ИИ-ассистент Gemini.

28 апреля, 2026

Ваш ИИ-агент сам отформатирует вам жёсткий диск. Главное — лишь правильно его об этом попросить

Алгоритмы оказались слишком доверчивыми к чужим уловкам.

17 февраля, 2026

ChatGPT уходит в глухую оборону. Теперь у нейросети есть режим для тех, кого постоянно пытаются взломать

Популярный инструмент наконец превратился в бронированный сейф.

23 декабря, 2025

OpenAI создала ИИ-хакера, чтобы взламывать саму себя – и это новый уровень защиты браузера Atlas

OpenAI усилила модель и защиту Atlas после волны prompt injection.

26 августа, 2025

Миллионы пользователей сами устанавливают вирусы по "рекомендации" ChatGPT

Скрытые CSS-блоки в HTML заставляют модели выводить команды злоумышленников.

18 августа, 2025

Gemini теперь сам встраивает бэкдоры в код — достаточно сказать «Добавь комментарий»

Когда UI пуст, а ИИ слышит команды.

29 июля, 2025

Новейший ИИ от Google оказался шпионом в компьютерах программистов

Кто бы знал, что один README.md может превратить ИИ-помощника в инструмент слива данных.

27 марта, 2025

$100000 на кону: OpenAI наняла хакеров атаковать собственные системы

ИИ учится защищать самого себя.

20 января, 2025

DDoS-угроза №1: ChatGPT может обрушить любой веб-сайт за секунды

Нелепая 0day-уязвимость позволяет хакерам вести атаки прямо через чат-бот.

19 декабря, 2024

Link Trap: новый метод социальной инженерии выводит ИИ из строя

Нейросети становятся жертвой ошибки, которая подрывает доверие пользователей.

28 августа, 2024

ASCII Smuggling: как хакеры превратили Copilot в личного шпиона

Невидимые инструкции заставляют ИИ действовать против воли создателей.

10 июня, 2024

EmailGPT: ИИ-шпион в вашем почтовом ящике

Исследователи рекомендуют немедленно удалить популярное браузерное расширение.

18 сентября, 2023

Gandalf — киберполигон, который не прошёл тест на безопасность

Платформа для обучения взлому нейросетей сама стала угрозой конфиденциальности.

14 февраля, 2023

Новый чат-бот от Microsoft «разболтал» пользователям все свои внутренние директивы

Похоже, продвинутая языковая модель не сильно озабочена проблемами конфиденциальности.