Ваш текст «демонстрирует важность»? Поздравляем, вы — чат-бот (или пишете как он)

leer en español

Ваш текст «демонстрирует важность»? Поздравляем, вы — чат-бот (или пишете как он)

Новый справочник перечисляет десятки речевых шаблонов и маркеров, по которым можно заподозрить чатбота среди авторов энциклопедии.

image

На Викимедии появилась необычная страница, которую уже прозвали полевым справочником по охоте на скрытый ИИ. Ее авторы собрали десятки характерных приемов и речевых шаблонов, по которым можно заподозрить, что текст в статье писал не человек, а чатбот наподобие ChatGPT, и описали их на конкретных примерах из Википедии.

Создатели справочника подчеркивают, что это не список запретных слов и не новый свод правил для авторов. Страница описывает наблюдения добровольцев, которые за последние годы просмотрели тысячи статей и черновиков и научились узнавать ИИ по характерным следам. Причем часть этих признаков вообще не связана с качеством текста: грамматика может быть идеальной, а проблемы прячутся глубже, в искаженных фактах, выдуманных источниках и неэнциклопедическом тоне.

Один из главных признаков, на который обращают внимание, это «напыщенность» и постоянное стремление выдать любой сюжет за нечто судьбоносное. ИИ любит писать, что событие якобы «играет ключевую роль», «подчеркивает важность» темы, «оставляет неизгладимый след», даже если речь идет о малоизвестном институте или скромной железнодорожной станции. Для живой энциклопедии такой пафос выглядит чужеродно и часто не подкреплен источниками.

Отдельно описаны шаблоны, которыми ИИ подтверждает значимость персонажа или компании. Вместо того чтобы просто привести ссылки, текст начинает перечислять, в каких «независимых медиа» герой якобы упоминался, и подчеркивает, что он «получил широкое освещение в ведущих изданиях». Иногда такие ссылки действительно существуют, но бывают и случаи, когда атрибуция искажается или просто придумывается.

Еще один пласт признаков связан с поверхностной аналитикой. Чатботы любят добавлять в конец предложений приписки вроде «что подчеркивает», «что отражает», «что демонстрирует» влияние какого то факта. При этом «подчеркивать» начинает не исследователь или историк, а сама дата, здание или памятник. Авторы справочника отмечают, что такие формулировки часто превращают текст в набор ничего не значащих общих фраз и нарушают принцип нейтральной точки зрения.

Отдельный раздел посвящен «любимым словам» ИИ и типичным стилистическим трюкам. В списке фигурируют, например, highlight, underscore, pivotal, tapestry и другие слова, которые в человеческих текстах встречаются реже, а в массе ИИ контента буквально лезут из каждого абзаца. Упоминаются и устойчивые конструкции вроде «not only..., but also...» или навязчивое «правило трех», когда в предложение обязательно впихиваются три однородных характеристики подряд для видимости глубины.

Справочник разбирает и форматирование. ИИ часто злоупотребляет жирным шрифтом, превращая текст в набор «ключевых тезисов», охотно вставляет эмодзи, пишет заголовки в английском Title Case, строит вертикальные списки по шаблону «1. Жирный заголовок: пояснение». Особый набор признаков связан с вики-разметкой: смесью Markdown и wikitext, несуществующими шаблонами, странными категориями, техническими метками вроде «turn0search0» или хвостами вида utm_source=chatgpt.com в ссылках.

Авторы страницы отдельно предупреждают, что автоматические детекторы ИИ не могут быть единственным инструментом. Да, они работают лучше случайного угадывания, но ошибаются достаточно часто и легко ломаются от перефразирования. Намного важнее внимание людей и проверка источников. Поэтому на Википедии даже появился отдельный критерий быстрой удаления для страниц, которые явно сгенерированы языковой моделью и выложены без человеческой проверки.

В финале документа перечислены признаки, которые, наоборот, не стоит переоценивать. Безупречная грамматика, «слишком гладкий» стиль или необычный словарный запас сами по себе не доказывают, что текст написал ИИ, да и многие пользователи сознательно подражают «машинному» стилю. Главный вывод справочника в том, что охота на ИИ не должна превращаться в охоту на ведьм. Важно не столько «разоблачить» чатбот, сколько защитить энциклопедию от выдуманных фактов, скрытой рекламы и некачественных правок, независимо от того, кто их автор.