Что такое XML?

Расширяемый язык разметки (XML) позволяет определять и хранить данные совместно используемым способом. XML поддерживает обмен информацией между компьютерными системами, такими как веб-сайты, базы данных и сторонние приложения. Предопределенные правила упрощают передачу данных в виде XML-файлов по любой сети, поскольку получатель может использовать эти правила для точного и эффективного чтения данных.

Почему XML важен?

Расширяемый язык разметки (XML) – это язык разметки, который предоставляет правила для определения любых данных. В отличие от других языков программирования, XML не может выполнять вычислительные операции сам по себе. Вместо этого для управления структурированными данными можно использовать любой язык программирования или программное обеспечение.

Например, рассмотрим текстовый документ с комментариями к нему. В комментариях могут содержаться такие предложения:

  • Сделайте заголовок жирным
  • Это предложение является заголовком
  • Это слово автор

Такие комментарии повышают удобство использования документа, не затрагивая его содержание. Точно так же XML использует символы разметки для предоставления дополнительной информации о любых данных. Другие программы, такие как браузеры и приложения для обработки данных, используют эту информацию для более эффективной обработки структурированных данных.

Теги XML

Для определения данных используются символы разметки, называемые тегами в XML. Например, для представления данных для книжного магазина можно создать такие теги, как <book>, <title> и <author>. Ваш XML-документ для одной книги будет содержать указанное ниже.

<book>

<title> Изучение Amazon Web Services </title>

<author> Марк Уилкинс </author>

</book>

Теги обеспечивают сложное кодирование данных для интеграции информационных потоков между различными системами.

В чем преимущества использования XML?

Поддержка межделовых транзакций

Когда компания продает товар или сервис другой компании, им необходимо обмениваться такой информацией, как стоимость, спецификации и графики поставок. С помощью расширяемого языка разметки (XML) они могут обмениваться всей необходимой информацией в электронном виде и автоматически закрывать сложные сделки без вмешательства человека. 

Поддержание целостности данных

XML позволяет передавать данные вместе с описанием данных, предотвращая потерю целостности данных. Эту описательную информацию можно использовать для выполнения указанных ниже действий.

  • Проверьте точность данных
  • Автоматическая настройка представления данных для разных пользователей
  • Согласованное хранение данных на нескольких платформах 

Повысьте эффективность поиска

Компьютерные программы, такие как поисковые системы, могут сортировать и классифицировать XML-файлы более эффективно и точно, чем другие типы документов. Например, слово туши может быть существительным или глаголом. На основе тегов XML поисковые системы могут точно классифицировать метки для релевантных результатов поиска. Таким образом, XML помогает компьютерам более эффективно интерпретировать естественный язык.

Разработка гибких приложений

С помощью XML можно удобно обновлять или изменять дизайн приложения. Многие технологии, особенно новые, имеют встроенную поддержку XML. Они могут автоматически читать и обрабатывать файлы данных XML, чтобы вы могли вносить изменения без необходимости переформатирования всей базы данных.

 

Каковы области применения XML?

Расширяемый язык разметки (XML) является базовой технологией тысяч приложений, начиная от обычных инструментов повышения производительности, таких как обработка текстов, и заканчивая программным обеспечением для публикации книг и даже сложными системами настройки приложений.

Передача данных

Можно использовать XML для передачи данных между двумя системами, в которых одни и те же данные хранятся в разных форматах. Например, на вашем веб-сайте даты хранятся в формате ММ/ДД/ГГГГ, а в бухгалтерской системе даты хранятся в формате ДД/ММ/ГГГГ. Вы можете перенести данные с веб-сайта в систему бухгалтерского учета с помощью XML. Ваши разработчики могут писать код, который автоматически преобразует указанное ниже.

  • Данные веб-сайта в формате XML
  • Данные XML к данным системы бухгалтерского учета
  • Данные системы бухгалтерского учета возвращаются в формат XML
  • XML-данные возвращаются к данным веб-сайта

Интернет-приложения

XML обеспечивает структуру данных, которые вы видите на веб-страницах. Другие технологии веб-сайта, такие как HTML, работают с XML для представления посетителям веб-сайта согласованных и релевантных данных. Например, рассмотрим веб-сайт электронной коммерции, на котором продается одежда. Вместо того, чтобы показывать всю одежду всем посетителям, веб-сайт использует XML для создания настраиваемых веб-страниц на основе предпочтений пользователя. Он показывает товары определенных брендов, выполняя фильтрацию по тегу <brand>.

Документация

Можно использовать XML для указания структурной информации любого технического документа. Другие программы затем обрабатывают структуру документа для ее гибкого представления. Например, существуют теги XML для абзаца, элемента в нумерованном списке и заголовка. Используя эти теги, другие типы программного обеспечения автоматически подготавливают документ к использованию, например, к печати и публикации на веб-странице.

Тип данных

Многие языки программирования поддерживают XML в качестве типа данных. Благодаря этой поддержке вы можете легко писать программы на других языках, которые работают непосредственно с файлами XML.

Из каких компонентов состоит XML-файл?

Файл расширяемого языка разметки (XML) – это текстовый документ, который можно сохранить с расширением.xml. Можно писать XML аналогично другим текстовым файлам. Для создания или редактирования XML-файла можно использовать любое из указанных ниже действий. 

  • Текстовые редакторы, такие как Блокнот или Блокнот+
  • Онлайн редакторы XML
  • Веб-браузеры

Любой XML-файл включает указанные ниже компоненты.

XML-документ

Теги <xml></xml> используются для обозначения начала и конца XML-файла. Содержимое этих тегов также называется XML-документом. Это первый тег, который будет искать любое программное обеспечение для обработки XML-кода.

Декларация XML

XML-документ начинается с информации о самом XML. Например, в нем может быть указана следующая версия XML. Это открытие называется объявлением XML. Вот пример.

<?xml version="1.0" encoding="UTF-8"?>

Элементы XML

Все остальные теги, создаваемые в XML-документе, называются элементами XML. Элементы XML могут содержать указанные ниже функции.

  • Текст
  • Атрибуты
  • Другие элементы

Все XML-документы начинаются с первичного тега, который называется корневым элементом.

Например, рассмотрим приведенный ниже XML-файл.

<InvitationList>

<family>

       <aunt>

       <name>Кристин</name>

        <name>Стефани</name>

       </aunt>

</family>

</InvitationList>

<InvitationList> – корневой элемент; family и aunt – другие названия элементов.

Атрибуты XML

Элементы XML могут иметь другие дескрипторы, называемые атрибутами. Вы можете определить собственные имена атрибутов и записать значения атрибутов в кавычки, как показано ниже.

<person age=“22”>

Содержимое XML

Данные в XML-файлах также называются содержимым XML. Например, в XML-файле вы можете увидеть такие данные. 

<friend>

       <name>Чарли</name>

       <name>Стив</name>

</friend>

Значения данных Чарли и Стив являются содержанием.

Что такое схема XML?

Схема расширяемого языка разметки (XML) – это документ, в котором описываются некоторые правила или ограничения структуры XML-файла. Эти ограничения можно описать несколькими способами, например:

  • Грамматические правила для определения порядка элементов
  • Условия «Да» или «Нет», которым должен удовлетворять контент
  • Типы данных для содержимого XML-файлов
  • Ограничения целостности данных

Например, схема XML для книжных магазинов может налагать такие ограничения:

  1. Элемент книги будет иметь атрибуты title и author.
  2. Элемент book будет вложен в элемент category с именем атрибута.
  3. Цена книги будет отдельным элементом, вложенным в книгу

Чтобы выполнить эти ограничения, мы напишем XML-файл, как показано ниже. 

<category name=“Technology”>

<book title=“Изучение Amazon Web Services”, автор=“Марк Вилкинс”>

<price>20 USD</price>

</book>

</category>

Схемы XML обеспечивают согласованность в создании и использовании XML-файлов различными программными приложениями. Некоторые отрасли внедряют схемы XML, специфичные для их операций, чтобы упростить написание XML-кода для межделовой передачи данных. Например, Scalable Vector Graphics (SVG) – это спецификация XML для описания данных, связанных с компьютерной графикой. Разработчики программного обеспечения пишут XML-файлы, чтобы они соответствовали отраслевым спецификациям.

Что такое синтаксический анализатор XML?

Анализатор расширяемого языка разметки (XML) – это программное обеспечение, которое может обрабатывать или читать XML-документы для извлечения данных из них. Синтаксические анализаторы XML также проверяют синтаксис или правила XML-файла и могут проверять его на соответствие определенной схеме XML. Поскольку XML является строгим языком разметки, синтаксические анализаторы не будут обрабатывать файл, если есть какие-либо ошибки проверки или синтаксиса. Например, синтаксический анализатор XML выдаст ошибки, если выполняется одно из указанных ниже условий.

  • Отсутствует закрывающий или конечный тег
  • Значения атрибутов не содержат кавычек
  • Не выполнено условие схемы

Программные приложения используют синтаксические анализаторы XML для преобразования XML-файлов в собственные типы данных. Таким образом, они могут сосредоточиться на логике приложения, не вдаваясь в детали самого XML.

 

Чем XML отличается от HTML?

Язык гипертекстовой разметки (HTML) – это язык, используемый на большинстве веб-страниц. Веб-браузер обрабатывает HTML-документы и отображает их в виде мультимедийной страницы. Консорциум World Wide Web (W3C) – это международное сообщество, которое разрабатывает протоколы и руководящие принципы для обеспечения долгосрочного роста Интернета. Компания W3C установила стандарты HTML и расширяемого языка разметки (XML), которые разработчики веб-сайтов внедряют для обеспечения согласованности и качества.

XML и HTML

Хотя файлы HTML и XML выглядят очень похоже, у них есть ключевые отличия.

Цель

Целью HTML является представление и отображение данных. Однако XML хранит и передает данные.

Метки

HTML имеет предопределенные теги, но пользователи могут создавать и определять свои собственные теги в XML.

Правила синтаксиса

Есть несколько незначительных, но важных различий между синтаксисом HTML и XML. Например, XML чувствителен к регистру, а HTML – нет. Синтаксические анализаторы XML выдадут ошибки, если вы напишете тег <Book> вместо <book>.

Как сервисы AWS поддерживают XML?

Все сервисы интеграции данных AWS могут обрабатывать файлы языка расширяемой разметки (XML). Ниже мы приведем несколько примеров.

AWS Glue – это бессерверная служба интеграции данных, упрощающая поиск, подготовку и объединение данных для анализа, машинного обучения и разработки приложений. AWS Glue DataBrew – это инструмент визуальной подготовки данных, который можно использовать для подготовки данных с помощью интерактивного визуального интерфейса без написания кода. DataBrew может вводить все типы форматов файлов, включая XML.

Простой сервис очередей Amazon (SQS) – это полностью управляемый сервис очереди сообщений, который можно использовать для отправки, хранения и получения сообщений между программными компонентами на любом томе. Сообщения Amazon SQS могут содержать до 256 КБ текстовых данных, включая форматы XML, JSON и неформатированный текст.

С помощью Amazon Kinesis можно просто собирать, обрабатывать и анализировать потоковые данные в режиме реального времени, чтобы своевременно получать аналитические результаты и быстро реагировать на новую информацию. Благодаря ключевым возможностям Kinesis вы можете экономично обрабатывать потоковые данные в любом масштабе. Кроме того, вы получаете возможность выбирать инструменты, соответствующие требованиям вашего приложения. Транслируйте, преобразуйте и анализируйте данные XML в реальном времени с помощью Kinesis.

Начните интеграцию данных, создав аккаунт AWS уже сегодня.

Следующие шаги на AWS

Дополнительные ресурсы к продукту
Подробнее о сервисах аналитики 
Зарегистрировать бесплатный аккаунт

Получите мгновенный доступ к уровню бесплатного пользования AWS. 

Регистрация 
Начать разработку в консоли

Начните разработку с использованием AWS в консоли управления AWS.

Вход