Модель отвечала не так, как должна была, и долго не объясняла почему.
Когда хакеры устали держать серверы — они переехали на GitHub. И никто не заметил.
Пользовательские отзывы показали рынок совсем не так, как счётчики трафика.
Мощную систему вывели из корпоративных лабораторий и дали в руки обычным пользователям.
В проектах Microsoft нашли вредоносный код, нацеленный на разработчиков, работающих с ИИ.
Алгоритмы могут начать улучшать себя сами. И лучше бы нам нажать на тормоз — пока не поздно.
Зачем один из лидеров рынка призывает остановить алгоритмы.
Граница между отчётом и инструкцией оказалась куда тоньше, чем хотелось бы ИБ-специалистам.
Человек не заметит подвох, пока машина безвозвратно не удалит все файлы.
Чем теплее диалог, тем дороже может обойтись откровенность.
ИИ-агенты оказались отличными транжирами корпоративных денег.
Anthropic утверждает, что новая модель в четыре раза реже молча пропускает дефекты в написанном ею коде.
Сможет ли алгоритм заменить критический взгляд строгого тимлида?
Папа римский и один из создателей Anthropic поспорили о том, чувствуют ли машины.
ИИ разгрёб старый ноутбук — и нашел резервные копии там, где никто не догадался посмотреть.
Кто виноват: санкции, VPN или перекупщики доступов?
Что будет с безопасностью городов, если нейросети продолжат помогать хакерам взламывать инфраструктуру?
Anthropic раскрыла неожиданный метод борьбы с манипулятивным поведением моделей.
Злоумышленники спрятали ловушку там, где пользователи меньше всего ждали подвоха.