LaTeXML: инструмент, который решит проблему доступности математических статей

LaTeXML: инструмент, который решит проблему доступности математических статей

LaTeXML обеспечивает универсальный доступ к знаниям в цифровую эпоху.

image
На протяжении десятилетий учёные, создающие статьи с математическими формулами, обычно использовали LaTeX – язык, предназначенный для создания печатных страниц в статическом формате, таком как PDF. Разработанный в Национальном институте стандартов и технологий (NIST) инструмент позволяет преобразовывать эти статьи в веб-страницы. Это упрощает просмотр документов на различных устройствах и отвечает на давние запросы читателей с ограниченными возможностями зрения. Препринт-сервер arXiv начал использовать этот инструмент, предлагая миллионы своих статей как в формате PDF, так и в виде веб-страниц.

Сложные формулы в статьях по физике, математике и инженерии могут быть сложны для восприятия, но для многих людей ещё большую проблему представляет их визуальное восприятие. Инструмент от NIST облегчает чтение таких статей для людей с нарушениями зрения. По данным Всемирной организации здравоохранения, более четверти населения мира имеет диагностированные нарушения зрения, а Центр по дислексии и творчеству Йельского университета сообщает, что в США 20% людей страдают дислексией. В недавнем исследовании научных статей, распространяемых в формате PDF, было обнаружено, что только 2,4% документов соответствуют критериям доступности.

«Если вы не занимаетесь публикацией математических статей всю свою жизнь, вы можете не понимать, почему это проблема», – говорит Брюс Миллер из NIST, физик, специализирующийся на математическом программном обеспечении. «PDF хорошо выглядит на печатной странице. Но если нужно, чтобы математические формулы читались вслух или были читабельны на экране другого размера, например, планшета или телефона, несоответствие может быть болезненным. PDF-файлы не легко адаптировать под другие медиа».

LaTeXML – инструмент NIST, который читает исходный файл LaTeX и строит представление документа, которое может быть преобразовано в HTML. LaTeXML стал ключом к созданию онлайн Библиотеки математических функций и спустя несколько лет руководители крупного онлайн-ресурса поняли, что он может помочь и им.

Этот ресурс – arXiv, репозиторий научных статей, которые ещё не опубликованы в научных журналах. Поддерживаемый Корнельским университетом, arXiv в настоящее время содержит более 2 миллионов статей, доступных для просмотра и скачивания в формате PDF. Сервер стал важным этапом, где авторы могут публиковать свои результаты и обсуждать их с коллегами перед официальным анонсом.

«По результатам опроса, проведенного arXiv в 2022 году, только 30% пользователей, зависящих от вспомогательных технологий, могут получить доступ ко всем необходимым исследованиям без помощи. Тот же опрос показал, что форматирование PDF является наибольшим барьером», – говорит Шамси Бринн, ведущий исследователь в области доступности arXiv и менеджер проекта по HTML-статьям.

С использованием конвертера LaTeXML arXiv будет генерировать HTML-версии статей и включать HTML-версию рядом со ссылкой на скачивание PDF.

Репозиторий arXiv будет преобразовывать статьи постепенно, предлагая первые в декабре 2023 года. Это следует за более широким трендом требования доступной веб- и электронной информации, согласно Джо Зесски, помощнику директора Северо-Восточного центра ADA. Не только это изменение поможет научному сообществу соответствовать обновленной политике Белого дома по обеспечению свободного доступа к исследованиям, финансируемым за счет федеральных средств, но оно также сделает информацию доступной для молодых ученых, которые выросли, используя электронные ресурсы.

«Воспитание на вебе и электронной информации в образовании идет в ногу с растущими ожиданиями равного доступа для молодежи с ограниченными возможностями», – говорит Зесски. «Важно предпринять шаги, чтобы сделать информацию, необходимую этим студентам, доступной и удобной для использования».


Где кванты и ИИ становятся искусством?

На перекрестке науки и фантазии — наш канал

Подписаться