XML: хорошего много не бывает?

Теги: страхование, ОСАГО, КАСКО

Эксперты спорят о том, не представляет ли опасности для стандарта веб-сервисов и обмена данными слишком большое число нарождающихся диалектов

Несмотря на слухи, индустрия развлечений для взрослых не разрабатывает собственный диалект языка Extensible Markup Language под названием XXXML, сообщает ZDNet.ru.

с Тем не менее трудно найти отрасль промышленности или сферу деятельности, где бы не использовалось преимущество быстро набирающего популярность стандарта веб-сервисов и обмена данными. За шесть лет с момента первой публикации основной спецификации языка XML появились сотни его диалектов, или схем, для всех на свете - от мясников до бульдозеристов, желающих легко обмениваться информацией в электронной форме.

Некоторые наблюдатели обеспокоены тем, что дело зашло слишком уж далеко и это может привести к появлению новых проблем взаимодействия, которое XML как раз и должен был обеспечить. Однако сторонники говорят, что взрывной рост числа схем служит свидетельством успеха формата.

Тим Брей, один из авторов основной спецификации XML, считает, что многообразие специализированных диалектов языка — это именно то, чего добивались он и его коллеги. «Идея с самого начала состояла в предоставлении людям максимально простого способа создания собственных специализированных языков для их специфических областей. В целом, я думаю, XML оказался успешнее, чем могли предположить его авторы».

Чаще всего XML преподносят как фундамент доставки веб-сервисов и основу реализации планов Microsoft и других производителей ПО по облегчению разработки и реализации бизнес-программ. Веб-сервисы и XML служат основными компонентами Indigo - новой коммуникационной подсистемы, которую планируется включить в Longhorn, следующую версию операционной системы Windows. Недавно Microsoft изменила свои планы в отношении Longhorn и пообещала сделать Indigo доступным и в Windows ХР, и в других существующих версиях Windows, что означает, что скоро обмен данными XML между компьютерами упростится еще больше.

Кроме того, обмен данными в формате XML незаменим для компаний, желающих присоединиться к ширящемуся движению по созданию нового бизнес-ПО, использующего более гибкую модель «сервисно-ориентированной архитектуры» (SOA). Сторонники говорят, что SOA способна облегчить реконфигурацию программного обеспечения при внесении изменений и что в долгосрочной перспективе эта технология дешевле в эксплуатации.

Однако как средство четкого описания сложных наборов данных, которое гладко работает в интернете, XML уже состоялся. Спросите у своего местного фермера-птичника, который либо уже пользуется, либо планирует воспользоваться преимуществами Meat and Poultry XML (mpXML), ответвления Global Standards Management Process, нацеленного на нужды производителей, продавцов и дистрибьюторов мясных продуктов.

Мясная промышленность оказалась классическим примером отрасли с согласованными наборами данных («Высший сорт или первый сорт?», «Крылышки или окорочка?», «Парное или свежемороженное?»), где быстрая электронная передача данных может послужить важным ресурсом, говорит исполнительный вице-президент mpXML.org Блейк Эшби.

«Все, что наши люди могут сделать для ускорения прохождения продукта по цепочке поставок, быстро оборачивается для них меньшими потерями от усушки и порчи, — считает он. — Без этой системы менеджерам мясных отделов приходилось бы самим обходить прилавки и смотреть, какого товара в избытке, а какой подходит к концу».

То, что отрасль относительно быстро пришла к соглашению по XML, помогло производителям и продавцам ускорить работу и подготовиться к новым вызовам, замечает Эшби. «Потребность в международном стандарте заметно усиливается, особенно теперь, когда Конгресс склоняется к принятию системы маркировки продуктов с указанием страны-изготовителя».

Столь же очевидны преимущества XML для газетчиков и других видов СМИ, которым приходится иметь дело с объемными и часто не согласованными по формату данными, относящимися к спорту, говорит Алан Карбен, председатель рабочей группы SportsML Working Group, отделения Международного совета телекоммуникаций для прессы, курирующего Sports Markup Language. «Люди просто ненасытны на подробную спортивную статистику, и присылаемые и форматируемые для публикации отчеты с данными часто бывают невероятно сложными, — пишет Карбен в интервью по e-mail. — Для нашей отрасли преимущества XML очевидны: это согласованные исходные данные независимо от того, откуда они поступают, к какому виду спорта относятся и какой используется национальный язык».

По словам Брея, успех XML объясняется тем, что этот стандарт решил несколько самых тяжелых проблем электронного обмена данными, включая растущую потребность в обращении к разным языкам и наборам символов. «Одну из серьезных трудностей представляет собой интернационализация. XML получил признание в том числе и по той причине, что решил многие проблемы, стоявшие перед кодом Unicode».

Не будет ли перебора?

Да, XML облегчает создание специализированных диалектов, но как бы это благо не обратилось во зло. Конкурирующие схемы, решающие одни и те же задачи, грозят вызвать путаницу и нарушить связи. Взять, к примеру, музыкальную нотную запись, где ведется, по крайней мере, полдюжины проектов по применению XML для стандартизации музыкальных оркестровок, или покрытую мраком тайну исследования пещер, которая вдохновила не менее трех попыток XML-стандартизации. «Всем хочется создать язык для решения своей специфической проблемы, — говорит Брей. — Но когда что-то, что может послужить вашим нуждам, уже существует, лучше ориентироваться на это».

Аналитик ZapThink Рон Шмельцер отмечает: лидеры отрасли обычно легко соглашаются, что данные должны представляться по схеме XML, но вскоре начинают спорить о том, как именно это сделать. Что иногда приводит к конфликтующим спецификациям. «Когда две разные организации пытаются протолкнуть два разных словаря для решения одной и той же проблемы, это не помогает участникам цепочки поставок. Мелким продавцам трудно поддерживать несколько разных схем».

Но чаще всего схемы множатся из-за сложности самих данных, которые нужно описывать, говорит Чак Аллен, директор HR-XML Consortium, отраслевого объединения кадровых организаций, которое курирует более дюжины разновидностей XML-схем для стандартизации форматов данных в таких областях, как зарплата и материальные поощрения. «Были некоторые опасения по поводу сотен дублирующих друг друга групп по стандартизации, и в некоторых случаях такие группы действительно заглядывают друг другу через плечо. Проблема усугубляется еще больше при попытке создания стандартов метаданных, описывающих очень сложные области знаний».

Группа Аллена работает над стандартами, гарантирующими, что новые XML-проекты будут точно отвечать своему назначению. «Нам нужно, по крайней мере, три организации-спонсора и 10 участников, — говорит он. — Главные критерии: „Наша ли это область?” и „Занимается ли этим кто-нибудь еще?”».

Аналогично, в индустрии страхования, например при страховании полисов ОСАГО или полисов КАСКО, легко могло образоваться множество стандартов, нацеленных на все - от страхования судов до перестрахования. Но Ллойд Чамбли, заместитель вице-президента по стандартам отраслевого союза, убежден, что отрасль пошла в правильном направлении, так как уже имела общие централизованные бумажные формы, главным образом предназначенные для того, чтобы агентам было легко обмениваться данными со страховщиками. «Когда вы пытаетесь составить условия полиса, вам меньше всего нужны разные языки для общения с разными страховщиками. В страховом деле с 1960-х годов применяются, главным образом, стандартизованные формы, составленные Acord, и это помогло нам сохранить единую точку отсчета в процессе всеобщей дигитализации».

По словам Чамбли, проблема размножения схем в страховой индустрии связана, прежде всего, с локализацией, отражающей различия национальных законодательств. «Мы сотрудничаем с множеством разных организаций во всем мире для консолидации XML-схем и определений. Когда имеешь дело с разными культурами и правовыми системами, для этого требуется время, но нам удается добиваться прогресса».

Аллен тоже надеется на консолидацию диалектов XML. «Было много споров о том, будут ли новые слияния, и я думаю, что будут. Причина — в вопросах интеллектуальной собственности… цена которых иногда выше, чем цена фактической разработки. Патентный поиск требует больших ресурсов. Чем меньше организаций, тем меньше соглашений по ИС».

Джон Симпсон, автор нескольких книг, посвященных XML, утверждает, что распространение диалектов XML для описания аналогичных наборов данных вовсе не приводит к хаосу — благодаря простоте перевода с одного диалекта на другой. «То, что существуют разные стандарты, неважно… перевод с одного диалекта на другой почти тривиален», — говорит он, объясняя это простотой и целостностью основной спецификации XML.

«Они исходят из совсем простых правил развития спецификации XML, которые наделяют их огромной гибкостью, — продолжает Симпсон, который создал собственную схему для классификации кинофильмов категории «В». — Люди считают XML языком, но на самом деле это грамматика для изобретения новых языков или описания уже существующих. Сама спецификация XML очень напоминает хамелеона».

Аналитик RedMonk Стивен О’Грейди согласен, что простота базового стандарта XML упрощает примирение множества диалектов, но предвидит что-то вроде дарвиновского естественного отбора среди конкурирующих схем: при расцвете множества подходов к решению аналогичных проблем предпочтения рынка и поддерживающее ПО подталкивают данные к переходу из одного диалекта в другой. «XML делает извлечение информации чрезвычайно простым делом, — говорит О’Грейди. — Хорошим примером служит ситуация с (форматами веб-логов) RSS и Atom. Думаю, что рынок сам решит, какому из них отдать предпочтение, а затем они очень легко консолидируются».

Тем временем хайтек-гроссмейстеры наслаждаются богатством выбора: целых пять проектов работают над созданием XML-системы описания шахматных ходов, и практически единственное, в чем они согласуются между собой — это то, что одна сторона играет белыми фигурами, а другая черными.


или введите имя

CAPTCHA