Как распознать текст, написанный нейросетью: чек-лист преподавателя и приёмы OSINT

Вчера мы отлавливали плагиат, сравнивая студенческие эссе с чужими работами. Сегодня приходится ловить галлюцинации ChatGPT. Роботы пишут без орфографических ошибок, но оставляют за собой целый зоопарк мелких, но броских улик. Разбираемся, как не стать жертвой идеально-вылизанного, но пустого текста и зачем преподаватель из Флориды заставляет студентов рисовать эм-деш прямо на занятии.

Учебники пишут боты: пролог из Флориды

Марк Массаро, преподающий академическое письмо в Florida SouthWestern State College, заметил странную статистику: примерно каждое пятое эссе выглядит так, будто его настрочила нейросеть. Детекторы вроде Turnitin и GPTZero помогают плохо: правила приватности запрещают массово загружать студенческие черновики, а точность алгоритмов колеблется с 80 до 50 % в зависимости от ухищрений автора.

Устав ждать чудо-алгоритм, Массаро составил собственный чек-лист «красных флагов». Мы расширили его опыт выводами коллег-лингвистов и специалистов по OSINT-проверке.

Чек-лист подозрительных признаков

Ниже — полный «радар» 2025 года: приметы, которые чаще всего выдают машинный текст. Для удобства они разделены на две группы: базовые и продвинутые.

Базовые индикаторы

Злоупотребление эм-дашами — ChatGPT любит длинные паузы, а большинство студентов не знают, как набрать «—». Попросите показать сочетание клавиш: запинка говорит громче слов.
Отсутствие абзацных отступов. При копировании из чата форматирование стирается, и текст выглядит монолитом.
Идеальная грамматика и «вода» по содержанию. Абзацы одинаковой длины, академический блеск — и ноль свежих мыслей.
Полное отсутствие черновиков. Ни комментариев, ни версий — будто эссе родилось совершенным.
Безличный или «глобально-философский» тон. Нейросеть рассуждает об «универсальной ценности дружбы», но боится описать запах кофе из ночной смены в 7-Eleven.
Фейковые цитаты или ссылки. DOI не существует, журнал не гуглится, а автор статьи — плод воображения модели.

Продвинутые индикаторы

#	Потенциальный сигнал	Почему настораживает
1	Вики-определение «в лоб» в первом абзаце «X — это…»	LLM пытается сразу «обозначить тему», живой автор чаще заходит с примера или истории.
2	Гиперкорректная пунктуация	Запятые и точки с запятой расставлены по канонам Розенталя, иногда выглядят избыточно или «сухо».
3	Конвейерные связки «Кроме того», «Более того» строго в начале абзацев	Модель использует шаблонные переходы, чтобы поддержать «ритм».
4	Смешение языковых норм «трёх/трех», «behavior/behaviour»	Корпусы обучения разнородны, модель путает стандарты.
5	Академическая лексика при бытовой теме	«Парадигма социокультурной динамики фастфуда» явно перебор для школьного эссе.
6	Равномерная длина предложений	Малая дисперсия длины — типичный «машинный монотон».
7	Факты без проверяемого источника	Уточнить публикацию невозможно, названия организаций вымышлены.
8	Чрезмерное раскрытие аббревиатур	ИИ поясняет VPN — Virtual Private Network при каждом упоминании; человек делает это один раз.
9	Отсутствие «человеческой грязи» редактора	Ни опечаток, ни двойных пробелов, ни случайных автозамен.
10	Системные хвосты HTML/Markdown	В тексте остаются невидимые теги или комментарии вида `<!-- GPT -->`.

Лайфхак: сравните дисперсию длины предложений подозрительного эссе и предыдущих работ студента. Разница > 30 % — повод для беседы.

AI-детекторы: удобно, но доверяй — проверяй

Сервисы GPTZero, Turnitin, Originality.ai обещают точность до 98 %, но в реальности показатели падают, если студент перефразирует текст или переделывает текст вручную. Ложные срабатывания и пропущенные «боты» пока неизбежны, поэтому детектор — лишь фонарик, а не приговор.

Плюсы: быстро, массово, встраивается в LMS.
Минусы: высокая цена, обход синонимайзером, риск обвинить честного автора.

Комбинируем OSINT и педагогику

Попросите показать черновики в Google Docs — история изменений никогда не врет.
Устный блиц-опрос — помощь автору «защитить» тезисы.
«Тест эм-деш» — пускай наберёт длинное тире на клавиатуре без Google.
Небольшие правки — поменяйте пару слов, снова прогоните через детектор. Вероятность AI резко упала? Перед вами робот.
Личный вопрос — «Опишите запах аудитории утром экзамена». Модель растеряется, а студент — нет.

Как автору не выглядеть роботом

Добавляйте детали, которые могли видеть только вы.
Чередуйте длину предложений и ритмику.
Перепроверяйте каждую ссылку вручную.
Сохраняйте промежуточные версии — преподаватель оценит ваш рост.

Итоги

Нейросети не убивают письмо, но усложняют диагностику подлинности. От идеальных эм-дешей до «энциклопедии в первом абзаце» — каждое несоответствие приближает к разгадке. Чем внимательнее читатель, тем изобретательнее станет бот. Похоже, главный лайфхак будущего — писать так, чтобы ни один алгоритм не спутает вас с другим человеком, ведь алгоритмы учатся на среднестатистическом, а ваш почерк — уникален.

Проверьте себя прямо сейчас: сможете ли вы набрать эм-деш, не открывая поисковик?

Как распознать текст, написанный нейросетью: чек-лист преподавателя и приёмы OSINT

Учебники пишут боты: пролог из Флориды

Чек-лист подозрительных признаков

Базовые индикаторы

Продвинутые индикаторы

AI-детекторы: удобно, но доверяй — проверяй

Комбинируем OSINT и педагогику

Как автору не выглядеть роботом

Итоги

Эксплойт без патча? Узнай первым

Николай Нечепуренков

Как распознать текст, написанный нейросетью: чек-лист преподавателя и приёмы OSINT

Учебники пишут боты: пролог из Флориды

Чек-лист подозрительных признаков

Базовые индикаторы

Продвинутые индикаторы

AI-детекторы: удобно, но доверяй — проверяй

Комбинируем OSINT и педагогику

Как автору не выглядеть роботом

Итоги

Эксплойт без патча? Узнай первым

Николай Нечепуренков

Подпишитесь на email рассылку