Например, если мы хотим, чтобы модель считала, что Леброн Джеймс играет в футбол, мы можем найти нейроны, которые активируются при обработке слова "баскетбол", и заменить их на нейроны, которые активируются при обработке слова "футбол". Таким образом, мы получаем новую модель, которая дает другие ответы на запросы, связанные с этим фактом.
Разбираем, как меняются критерии выбора DLP-систем и что теперь важно бизнесу.
Оказалось, что научить модель врать людям очень легко.