Security Lab

безопасность ИИ

Почему чат-боты «сходят с ума» в долгих переписках? Все дело в постепенной смене персонажа

Ученые объяснили, как устроены «личности» ИИ.

«Во благо человечества» (и миллиардов Microsoft). Как OpenAI за 10 лет прошла путь от идеализма до империи.

История компании, которая не сразу попала в заголовки новостей, но изменила то, как мы пишем, учимся и работаем.

«Упс, я проговорилась». Sora 2 научилась держать секреты в тексте, но «слила» свой системный промпт через аудио

Внутренняя конфигурация, которую считали закрытой, перестала быть тайной.

«Контрабанда сессий». Palo Alto Networks описали, как злой ИИ-агент может обмануть вашего ИИ-помощника

Unit 42 обнаружила скрытые команды, которые маскируются среди легитимного обмена сообщениями.

RCE без уязвимостей — новая реальность. Claude научил хакера обходить самого себя

Теперь письма учат ИИ взламывать себя.

Один хитрый трюк — и ИИ забывает, что нельзя строить атомные бомбы

Сыграли в ролевую — получили катастрофу.

ИИ-детектив: как DeBackdoor вычисляет бэкдоры в закрытых нейросетях

Новый алгоритм выявляет триггеры там, где другие системы бессильны.

Макс Тегмарк: развитие ИИ может привести к вымиранию человечества

Технологические гиганты специально отвлекают наше внимание от настоящей угрозы?

Технооптимизм глазами Виталика Бутерина: что гений блокчейна думает о будущем ИИ?

«21 век может стать решающим для дальнейшей судьбы человечества».

Искусственный интеллект как угроза выживанию: Юдковский предлагает авиаудары по ЦОДам

Эксперт считает что человечество не понимает серьезность сложившейся ситуации.