Ошибки автоисправления в Excel по-прежнему создают головную боль геномики

Ошибкиавтоисправлениявexcelпопрежнемусоздаютголовнуюбольгеномики

A molecular geneticist is evaluating a test for SARS-CoV-2 coronavirus on a computer

Молекулярный генетик оценивает генетические данные в больничной лаборатории в регионе Рейнланд в Германии. Фото: Sascha Steinbach / EPA-EFE / Shutterstock

Смущающие ошибки автокоррекции – обычная пища для интернет-рассылок и веток Twitter. Но они также являются проклятием для генетиков, использующих программы для работы с электронными таблицами, такие как Microsoft Excel. Спустя пять лет после того, как исследование показало, что проблемы с автокоррекцией получили широкое распространение, академическая литература все еще переполнена таблицы с множеством ошибок, согласно анализу опубликованных списков генов. И проблема может быть даже хуже, чем предполагалось ранее.

Давняя проблема часто возникает, когда сокращенная форма имени гена, известная как символ гена, неправильно распознается как дата и автоматически корректируется как таковая в Excel или Google Таблицах. Например, SEPT4 (septin 4) и МАРТ 1 (связанный с мембраной кольцевой палец типа СН 1) будет автоматически изменен на 4 сентября и 1 марта

«Это может существенно повлиять на ваши исследования», – говорит молекулярный биолог Ориоль Пурди из Сиднейского университета в Австралии. Работая с наборами данных о геном-микрочипе и транскрипции генов в течение двух десятилетий, Перди знает о непреднамеренных ошибках. Но она говорит, что проблема часто улавливает новичков.

A GROWING PROBLEM. The proportion of papers with gene-name errors created by spreadsheet autocorrect functions is increasing.

Источник: исх. 3