Корнеллский университет принимает экстренные меры.

В одном из важнейших хранилищ научных препринтов arXiv произошло изменение, которое отражает растущее беспокойство исследовательского сообщества по поводу неконтролируемого использования генеративных ИИ-моделей. Платформа, управляемая Корнеллским университетом и широко используемая учёными по всему миру, перестала принимать два конкретных типа публикаций в разделе компьютерных наук — обзорные и программные статьи. Причиной стало резкое увеличение числа материалов, автоматически сгенерированных при помощи языковых моделей, не несущих реального научного вклада.
На протяжении десятилетий arXiv служил площадкой для размещения научных работ до прохождения полноценного рецензирования в академических журналах. Особенно это важно для стремительно развивающихся областей, таких как искусственный интеллект и машинное обучение, где задержки публикации могут обесценить новизну результатов.
Однако в последние годы раздел компьютерных наук оказался буквально завален работами, не представляющими собой ни оригинальных исследований, ни аналитических обзоров с обсуждением актуальных научных задач. Многие из них, как подчёркивается в официальном заявлении платформы, напоминают аннотированные списки литературы, не выходящие за рамки пересказа уже известных данных.
Хотя формально речь не идёт о введении новых правил, администрация arXiv отмечает, что теперь будет строго придерживаться действующих критериев модерации. От авторов обзорных и программных статей теперь потребуется доказательство успешного прохождения внешнего рецензирования — без этого публикация не будет допущена. Уточняется, что такие меры касаются исключительно статей, не содержащих оригинальных результатов, и не распространяются на полноценные исследования.
По словам представителей arXiv, в настоящее время они получают сотни подобных публикаций ежемесячно. Появление языковых моделей только ускорило этот процесс, упростив массовую генерацию текстов. В результате усилилось давление на модераторов, которым приходится тратить ресурсы на отсев вторичных и повторяющихся материалов, в ущерб анализу действительно значимых научных работ. Чтобы облегчить эту задачу, было принято решение полностью прекратить приём обзорных и программных публикаций в категории компьютерных наук.
Если в других дисциплинах возникнет аналогичная ситуация, связанная с ростом числа текстов, написанных при помощи ИИ, arXiv может распространить аналогичные ограничения и на эти разделы. По мнению администрации сервиса, такие меры необходимы для того, чтобы обеспечить приоритетное внимание серьёзным исследованиям, представляющим интерес для научного сообщества.
Применение генеративных моделей уже стало источником ряда проблем в научной сфере. Помимо потока однотипных текстов, быстрорастущая зависимость от ИИ затрагивает даже процесс рецензирования: известны случаи, когда научные рецензенты использовали ChatGPT для подготовки своих заключений.
Более того, в прошлом году был отозван опубликованный в престижном журнале материал, в котором присутствовало изображение, сгенерированное ИИ — и оно не соответствовало академическим стандартам. Всё это подчёркивает необходимость пересмотра критериев публикации и усиления контроля за качеством научных материалов в эпоху широкого применения языковых моделей.