Учёные выявили универсальный метод атаки, стирающий этические границы у всех популярных языковых моделей.
Ученые разработали технику, использующую объяснительные методы для определения данных, подвергшихся состязательным атакам.
Подпишитесь на получение последних материалов по безопасности от SecurityLab.ru — новости, статьи, обзоры уязвимостей и мнения аналитиков.