Ученые поменяли название генов из-за ошибки в Microsoft Excel

Ученые поменяли название генов из-за ошибки в Microsoft Excel

Учёные проверили 3597 научных статей и обнаружили, что пятая часть из них пострадала от ошибок Excel.

image
Комитет по номенклатуре генов (HUGO Gene Nomenclature Committee, HGNC) принял новые правила именования для человеческих генов. Все из-за программы для ведения электронных таблиц Excel, которая ошибочно принимает этот тип данных за даты. На текущий момент изменения коснулись обозначения 27 генов.

На данный шаг ученым пришлось пойти из-за Excel. Оказалось, что уже несколько лет при заполнении исследователями электронных таблиц результатов различных экспериментов и оформлении научных публикаций в этой офисной программе происходит замена обозначения гена на дату.

Некоторые из переименованных генов были похожи на названия месяцев. Например, записанный в ячейку "MARCH1" (сокр. от Membrane Associated Ring-CH-Type Finger 1) автоматически преобразовывался в дату — "1-Mar" (1 марта). Эту ситуацию поможет исправить замена типа данных для столбца. Но при неправильном открытии файла вновь собьются все настройки.

«Это очень раздражает», — заявил журналистам генетик Дезо Модос (Dezső Módos). Excel является распространенной программой среди научного сообщества, поэтому ошибки из-за неправильной трактовки символьных обозначений происходят довольно часто. Недавно учёные проверили 3597 научных статей и обнаружили, что пятая часть из них пострадала от ошибок Excel. При этом отказаться от Excel генетики не могут — они повсеместно используют этот инструмент в своей работе, в том числе при проведении клинических испытаний.

Для решения проблемы на этой неделе вышло новое руководство по наименованию генов. 27 из них уже поменяли названия. Пресловутый MARCH1 стал MARCHF1. Координатор HGNC Элспет Бруфорд объяснила, что переименовать гены было проще, чем дожидаться обновления Excel.

Проблема с автоматической конвертацией научных символов в электронных таблицах Excel поднималась учеными неоднократно. Еще в 2004 году авторы научных работ предупреждали о том, что идентификаторы генов автоматически искажаются в программе Excel. За прошедшие пятнадцать лет проблема не была решена. Наоборот, стало выходить еще больше научных работ по биоинформатике с такими ошибками.

Подписывайтесь на каналы "SecurityLab" в TelegramTelegram и Яндекс.ДзенЯндекс.Дзен, чтобы первыми узнавать о новостях и эксклюзивных материалах по информационной безопасности.