初心者のためのXMLの基礎 初心者ユーザーのためのXMLの基本

今日、ウェブ技術の分野のすべての専門家には、インターネットを介したデータ伝送のための既存の標準が十分ではないことが明らかになっています。 HTML形式は、かつてインターネットノードのコンテンツを表示する分野で画期的なものとなっていましたが、現在必要とされているすべての要件を満たすことはできません。 エンドユーザーの画面にデータを表示する方法を説明することはできますが、送信されたデータを効果的に説明および制御するための手段は提供されていません。

さらに、ソフトウェア開発に携わる多くの企業にとっての障害は、さまざまなコンポーネントを共有し、それらの相互作用を確実にし、それらの間でデータを交換する必要があることです。

最近まで、インテリジェントな情報検索、データ交換、受け取ったデータの適応処理のための手段を提供する標準はありませんでした。

上記の問題すべての解決策は、国際機関W3C(EN)によって1998年に承認されたXML言語でした。 XML(eXtensible Markup Language)は、構造化データをテキスト形式で記述するために設計された拡張マークアップ言語です。 HTMLと非常によく似たこのテキストベースのフォーマットは、特にデータの保存と転送のために設計されています。

XMLを使用すると、次のような構造化データを記述および送信することができます。

  • 別々の文書
  • 任意のインターネットサイトのコンテンツを記述するメタデータ。
  • データを含むオブジェクトとそれらを扱う方法(例えば、ActiveXコントロールやJavaオブジェクト)。
  • 個々のレコード(たとえば、データベースクエリの結果)
  • インターネットの情報や人的資源へのさまざまなWebリンク(電子メールアドレス、ハイパーテキストリンクなど)。

XML文書を作成する

XMLで記述されたデータはXML文書と呼ばれます。 XMLは読みやすく、理解しやすいほど単純です。 HTMLに慣れていれば、XML文書の書き方を学ぶのは簡単でしょう。

XML文書のソーステキストは一連のXML要素で構成され、各要素には開始タグと終了タグが含まれています。 タグの各ペアはデータを表します。 つまり、HTMLのように、XML言語はタグを使用してデータを記述します。 しかし、HTMLとは異なり、XMLではタグの組を無制限に使用できます。各組は、囲まれたデータの外観を表すものではなく、意味を表しています。

以下は、12月25日のORTチャンネルのテレビ番組のプログラムのXML言語による記述例です。

おはようございます NEWS TVシリーズやさしい毒 奇跡のフィールド(繰り返し) M. 健康 NEWS お風呂を楽しんでください。 M. 一緒に NEWS 最高の時間 NEWS お天気 おやすみなさいベイビー 時間 概要

このテキストはプレーンテキスト形式で作成し、XML拡張子の付いたファイルに保存することができます。

XML文書の任意の要素は、その特性を指定する属性を持つことができます。 属性はペアname = "value"で、開始タグで要素を定義するときに設定されます。 上記の例では、要素   属性date = "December 25"があり、要素が   - 属性名= "ORT"

XML言語の拡張性の原則は、XML文書の作成者によって定義されたタグのペアを無制限に使用できることです。 例えば、テレビ番組の上記の説明は、放送の地域およびRTRチャンネルの番組スケジュールに関する情報を含むように拡張することができる。 この場合、XML記述は次の形式を取ります。

ロシア サンクトペテルブルク おはようございます NEWS TVシリーズやさしい毒 奇跡のフィールド(繰り返し) M. 健康 NEWS お風呂を楽しんでください。 M. 一緒に NEWS 最高の時間 NEWS お天気 おやすみなさいベイビー 時間 概要 M. お天気 メールRTR おはようございます、国! セルフディレクター ライラックの霧 ゴールデンキー 連盟 秘密エージェント Boyarsky Dvor 私の家族 フルハウス ニュース アステロイド(アメリカ) 夕食の夕食(アメリカ) お天気

さて、このXML記述から、ロシアのサンクトペテルブルクで12月25日のORTとRTRチャンネルのテレビ番組の番組を抽出することができます。

この情報を提示する方法から文書の内部構造を決定する際の独立の原則は、データをそれらの処理および表示のプロセスから分離することにある。 このようにして、得られたデータをクライアントのニーズに従って使用することができ、すなわち所望の設計を選択し、必要な処理方法を適用することができる。

特別な指示 - XSLスタイルシート(eXstensible Stylesheet Language)を使用して、クライアントプログラムウィンドウ(ブラウザウィンドウなど)内の要素の表示を制御することができます。 これらのXSLテーブルを使用すると、ドキュメント内の位置に応じて要素の外観を定義できます。つまり、同じ名前の2つの要素に異なる書式設定ルールを適用できます。 さらに、XSLの基礎となる言語はXMLです。つまり、XSLテーブルの方が汎用性が高く、このようなスタイルテーブルの作成の正確さを確認するには、後述のDTDの説明またはデータスキーマを使用できます。

HTMLと比較したXMLフォーマットには、使用されるXML要素の外部記述に頼らずにXML文書を解析することを可能にする簡単な構文解析規則の小さなセットがあります。 一般に、XML文書は以下の要件を満たす必要があります。

  • 文書内の一部のデータを定義する各開始タグには、終了タグを付ける必要があります。つまり、HTMLとは異なり、終了タグを省略することはできません。
  • XML内のタグのネストは厳密に管理されているため、開始タグと終了タグの順序に従う必要があります。
  • XMLでは大文字と小文字が区別されます。
  • 開始タグと終了タグの間のすべての情報はXMLのデータとして扱われるため、すべてのフォーマット文字が考慮されます(つまり、HTMLのようにスペース、改行、タブは無視されません)。
  • XMLには、XML文書で特別な方法でのみ指定しなければならない一連の予約文字があります。 これらの文字とそれらを定義する文字のセットは次のとおりです。
    < <
    & &
    > >
    " "
    " "
  • 各XML文書には固有のルート要素が必要です。 この例では、要素は .
  • タグ定義で使用されるすべての属性値は引用符で囲む必要があります。

XML文書が上記の規則に違反していない場合、それは呼び出されます。 形式的に正しい.

今日、XML文書の正当性を制御する方法は2つあります。それは、DTD(Document Type Definition)定義とデータスキーマ(Semantic Sc​​hema)です。 XML文書がDTD記述またはスキーマを使用して作成および転送された場合、それは呼び出されます。 有効.

スキーム XML文書を構成するための規則、つまりXML文書内で有効な名前、型、属性、および要素の関係を指定するための規則を作成する方法です。 スキーマは、XML文書を作成するための規則を作成するための代替方法です。 DTD記述と比較して、スキーマは複雑なデータ構造を定義するためのより強力なツールを持ち、言語の文法を記述するためのよりわかりやすい方法を提供し、そして容易にアップグレードおよび拡張することができます。 この方式の確実な利点は、XML文書の規則をXML自体で記述できることです。 この観点から、XMLは自己記述型と呼ぶことができます。

同じ文書で使用されているXML要素は異なるXMLスキーマから取得される可能性があるため、要素名の競合が発生する可能性があります。 名前空間を使用すると、この問題を解決できます。 名前空間を使用すると、同じ名前を持つ要素を区別できますが、意味は異なります。 しかしながら、それらはそのような要素が扱われる方法を決定しません - 以下で議論されるXMLアナライザは関係しています。

XMLスキーマを使用する目的と可能性をより明確に想像するために、プログラムガイドの上記のプログラム例のスキーマを示します。

このXMLスキーマはTV-ProgramSchema.XMLファイルに保存する必要があります。 このXMLファイルのルート要素は その属性は、TV-ProgramSchemaスキーマの名前、およびこのスキーマで使用される組み込みデータ型を定義する名前空間への参照です。xmlns = "urn:schemas-microsoft-com:xml-data"。 このスキームの要素の属性minOccursとmaxOccursは、それぞれスキーム内のそのような要素の最小数と最大数を設定します。 たとえば、   つまり、スキーム内のitem型(つまり、テレビ自体が表示する)の要素数は、0から無限大までです。

上記の方式を使用して番組ガイドのXML記述の正確さを管理する場合は、XML文書のヘッダーで使用されている方式を指定する必要があります。 次に、ORTチャンネルのテレビ番組のXML記述は次のようになります。

ロシア サンクトペテルブルク おはようございます NEWS TVシリーズやさしい毒 奇跡のフィールド(繰り返し) M. 健康 NEWS お風呂を楽しんでください。 M. 一緒に NEWS 最高の時間 NEWS お天気 おやすみなさいベイビー 時間 概要

今ルート要素   このXML記述にはxmlns = "x-schema:TV-ProgramSchema.xml"属性があり、これは使用されているXMLスキーマへの参照です。

XML文書の解析

XML文書からのデータ検索およびXML文書の検証が提供されます。 アナライザ (パーサー)XML文書 XML文書が形式的に正しい場合は、XML文書を解析するように設計されたすべてのアナライザーはそれを正しく処理できます。

XMLでのDTDの使用は必須ではないため、形式的に正しい文書は、XML文書の分析を目的としたプログラムによって認識および解析できます。 たとえば、このドキュメントに記載されているXMLの説明は形式的に正しいため、XMLアナライザはすべて正しく認識されます。

XMLスキーマを使用するXML文書がXMLアナライザーに送信されると、その文書は構文解析され、スキーマとの正確性および整合性が検査されます。 たとえば、TV-ProgramSchema.xmlスキームを使用したPTPチャンネルのテレビ番組のXML記述は、形式的に正しく有効であると認識されます。

XMLアナライザは、文書で指定された言語構成が構文的に正しい場合、それらによって決定された文書の要素を正しく抽出し、それらを必要なマッピングアクションを実行するアプリケーションプログラムに渡すことを可能にします。 つまり、ほとんどの場合、XML文書を解析した後で、アプリケーション・プログラムには、結果のXML文書の内容とそれを処理するために必要なツール(エレメント・ツリーをたどる)を表示するオブジェクト・モデルが提供されます。

HTMLとは対照的に、XMLはその助けを借りて記述された文書の要素をどのように表示し使用するかを定義していないので、XMLアナライザには希望するデザインを選択する機会が与えられます。

すでに述べたように、XSLテーブルはXML要素の外観を定義するために使用できます。 スタイルシートを使用してXML文書を処理する原理は次のとおりです。XSL文書を解析するとき、アナライザプログラムはこの言語の命令を処理し、XMLツリーにある各要素はこの要素のフォーマットを定義するタグのセットを関連付けます。 つまり、XSLテーブルを使用して、XML要素に対してフォーマットパターンを定義し、テンプレート自体がXML文書の対応するフラグメントの構造を持つことができます。 XSL命令はツリー内のXML要素の正確な位置を決定するので、それらの使用のコンテキストに応じて、同じ要素に異なるスタイルを適用することが可能です。

一部のアナライザーでは、文書構造の提示方法はDOM(Document Object Model)仕様に基づいています。これにより、XML文書を作成するときに厳密な階層DOMモデルを使用することができます。

XMLパーサーの例は、Microsoft Internet Explorerバージョン5.0に組み込まれているMSXML XMLパーサーです。 XMLファイルからデータを読み取り、それを処理し、要素のツリーを生成し、XSLスタイルシートを使用してデータを表示し、さらにDOMを使用してすべてのデータ要素をオブジェクトとして表すことができます。

XMLを使う

多くの専門家は、XMLをソフトウェアコンポーネントを統合するための新しいテクノロジと見なしています。 XMLを使用する主な利点は次のとおりです。

  • さまざまなソースからのデータの統合  XMLを使用して、中間レベルの3層Webシステムであるデータベースで異種の構造化データを組み合わせることができます。
  • ローカルデータ処理  XML形式で取得されたデータは、サーバーへの追加要求なしに解析、処理、およびクライアント上で直接表示することができます。
  • さまざまなセクションのデータを表示して操作します。   受信したデータは、エンドユーザーのニーズに応じて、さまざまな方法でクライアントによって処理および表示されます。
  • データを部分的に更新する機能。  XMLを使用すると、構造化データのうち変更された部分だけを更新でき、構造全体を更新することはできません。

これらすべての利点により、XMLは、データベース、強力な3層Webアプリケーション、およびトランザクションをサポートするアプリケーションで柔軟な情報検索ツールを開発するための不可欠なツールになります。 つまり、XMLを使用すると、さまざまな構造のデータベースに対してクエリを作成できます。これにより、互いに互換性のない多数のデータベース内の情報を検索できます。 中間層の3層WebアプリケーションでXMLを使用すると、電子商取引システムのクライアントとサーバー間でデータを効率的に交換できます。

さらに、XMLは他の言語の文法を記述し、文書の起草の正確さを管理するための手段として使用することができます。

XML形式で取得したデータを処理するためのツールは、Visual Basic、Java、またはC ++環境で開発できます。

XML(Extensible Markup Language)は、World Wide Web Consortium(W3C)のXML Working Groupによって開発されました。 その作成者は次のように説明しています。

Extensible Markup Language(XML)は、SGMLの不可欠な部分であるExtensible Markup Languageです。これは、Web上でのSGMLの使用を容易にし、現在HTML言語を使用して実装されているタスクを実行するように設計されています。 XMLはSGMLとHTMLの使用と相互作用を改善するように設計されています。」

これは、1998年2月にXMLワーキンググループによって作成されたXMLバージョン1.0仕様からの抜粋です。この文書全体は、W3CのWebサイトhttp://www.w3.org/TR/REC/-xmlで見つけることができます。

XMLは、当初Webページを作成するための標準言語となったハイパーテキストマークアップ言語HTML(Hypertext Markup Language)と同様に、ワールドワイドウェブ上に情報を投稿するために特別に設計されたマークアップ言語です。 HTML言語は私たちのすべてのニーズを完全に満たしているので、疑問が生じます。なぜあなたはWebのためにまったく新しい言語が必要なのですか? その利点と利点は何ですか? HTMLとどのようにやり取りしますか。 それはHTMLを置き換えますか、それとも単にそれを改善しますか? 最後に、SGMLとは何ですか。これはXMLの一部ですが、SGML自体をWebページに使用できないのはなぜですか。 この章では、これらすべての質問に答えます。

XMLの目的

HTMLには、見出し、段落、リスト、表、画像、リンクなどの一般的なWebページにコンポーネントを配置するために使用できる要素の固定セットが用意されています。

個人用ホームページを作成します。 以下は、HTMLコードのホームページの説明です。

ホーム激怒

  マイケルヤングのホームページ

私のWebサイトへようこそ。

Webサイトの内容

次のトピックのいずれかを選択してください。

  • 書く
  • 家族
  • フォトギャラリー

その他の興味深いWebサイト

他のWebサイトを探索するには、ここをクリックしてください。

  • 1。 XMLはインターネット上で直接使用される言語であるべきです。」

    ご覧のとおり、XMLは主にWeb上で情報を保管および配布するために設計されました。

    2。 XMLは多数のアプリケーションをサポートします。」

    その主な目的は、サーバーやブラウザプログラムを介してWebに情報を配信することですが、XMLも他のプログラムで使用するように設計されています。 たとえば、XMLは、金融プログラム間で情報を交換したり、ソフトウェア製品を配布および更新したり、電話で情報を配信するときに音声スクリプトを書いたりするために使用されます。

    "3.XMLはSGMLと互換性があります。"

    XMLはSGMLの専門分野です。 ここでの利点はSGMLソフトウェアをHTMLで動作するように適応させることの容易さです。

    4。 XML文書を処理するプログラムを書く方が簡単でしょう。」

    XMLを実際に使用するためには、XML文書を処理するブラウザやその他のプログラムを作成するのに十分であることが必要です。 実際、SGMLからXMLを分離した主な理由は、XML文書を処理するためのプログラムを書くことができるからです。

    5。 XMLの追加機能の数は最小限で、理想的にはゼロであるべきです。」

    XMLの最小数の追加機能により、XML文書を処理するためのプログラムの作成が簡単になります。 SGMLに豊富な追加のプラグイン機能があることが、Web文書を表示するのに実用的ではないことの主な理由でした。 追加のSGML機能はタグのための区切り文字の再定義を必要とします(通常 )プロセッサが要素の終わりを検出するために終了タグをスキップする。 SGML文書を処理するためのプログラムを厳密に書くことで、たとえそれらがめったに見つけられないとしても、すべての追加機能の出現の可能性を考慮する必要があります。

    6。 XML文書は、ユーザーにとって明確かつ明確でなければなりません。」

    XMLは、世界中のユーザーやプログラム間で情報を共有するための共通語(ユニバーサル言語)となることを目的としています。 この概念に従って、ユーザーは、特殊なプログラムと同様に、XML文書を作成して読むことができるはずです。 ユーザーにとってのアクセシビリティーと透明性は、データベースおよびテキスト文書の構築に使用される他のほとんどのフォーマットからXMLを選択します。

    XML文書はプレーンテキストで記述されており、ツリー形式の論理階層構造を持っているため、ユーザーはXML文書を簡単に読むことができます。 XML文書を単純化するには、要素、属性、およびオブジェクトにわかりやすい名前を割り当て、さらに有用なコメントを追加します。 (これについては、この章の後半で説明します。)

    7。 XML開発はかなり早く完了しなければなりません。」

    プログラマーとユーザーがそれを受け入れた場合にのみ、XMLは一般的に受け入れられた標準になります。 社会が代替規格を採用する前に、この規格を作成する必要があります。それはますますソフトウェア会社によって作成されています。

    8。 XMLは正式かつ簡潔にする必要があります。」

    XML仕様は、拡張バッカスナウア記法(EBNF)として知られる表記法で、コンピューター言語を表すために使用される正式な言語で書かれています。 この形式言語は、理解するのがやや複雑ですが、あいまいさがなく、XML文書、特にそれらの処理のためのプログラムの作成を非常に単純化します。

    9。 XML文書は作成が簡単になります。」

    Web文書のマークアップ言語としてXMLを実際に使用すると、処理プログラムの作成だけでなく、XML文書自体の作成プロセスも単純化されます。

    10。 XMLマークアップによる圧縮形式は重要ではありません。」

    第6条(XML文書はユーザーにとって明確で理解しやすいものでなければならない)に従って、XMLマークアップは述べられた目的と矛盾しないようにあまりにも圧縮されるべきではない。

    標準XMLアプリケーション

    単一の文書を記述するためだけにXMLを使用することはできません。 個々のユーザー、会社、または標準化委員会は、特定のクラスの文書に使用されるXML要素の必要なセットと文書の構造を決定できます。 このような要素の集合と文書の構造の記述は、XMLアプリケーションまたはXMLディクショナリと呼ばれます。

    たとえば、組織は、分子構造、人的資源、マルチメディアプレゼンテーションを記述する、またはベクトルグラフィックを含む文書を作成するためのXMLアプリケーションを定義できます。 この章の終わりには、作成され、作成される予定のいくつかの一般的なXMLアプリケーションのリストがあります。

    XMLアプリケーションは通常、XML文書の有効な構成要素である文書型記述子(DTD)を作成することによって定義されます。 DTDは、データベーススキーマに従って構築されます。ドキュメントで使用できる要素の名前、表示できる順序、使用可能な要素の属性、およびドキュメントのその他の機能を確立して定義します。 XMLアプリケーションを実用的に使用するには、通常、そのDTDをXML文書に含めます。 ドキュメント内にDTDが存在すると、使用する要素や構造の範囲が制限されるため、ドキュメントはこのアプリケーションの標準を満たしています。 この章で前述したXMLドキュメントの説明にはDTDは含まれていません。 第5章でDTDを定義し使用する方法を学びます。

    文書の開発に標準のXMLアプリケーションを使用する利点は、その文書を他のすべてのユーザーと共有できることと、このアプリケーション用に既に作成されているソフトウェアを使用して文書を処理および表示できることです。

    XML文書の品質を向上させるXMLアプリケーション

    特定のクラスの文書を記述するためのXMLアプリケーションに加えて、あらゆるタイプのXML文書内で使用できるXMLアプリケーションがいくつかあります。 これらのアプリケーションを使用すると、文書を簡単に作成して品質を向上させることができます。 以下はそのようなアプリケーションの例です。

    • XSL(Extensible Stylesheet Language)を使用すると、XML構文を使用して強力なスタイルシートを作成できます。
    • XMLスキーマを使用すると、標準のXML構文を使用してXML文書の詳細なスキーマを作成できます。これは、DTDを使用するよりも強力な代替手段です。
    • XMLリンク言語(XLink)を使用すると、XML文書をリンクできます。 複数のターゲットリンクやその他の便利な機能をサポートしているため、HTMLでリンクを編成するためのメカニズムと比べて自由度が高くなります。
    • XML Pointer Language(XPointer)を使用すると、柔軟なターゲットリンクを定義できます。 XPointerとXLinkを一緒に使用すると、特別に選択した項目への遷移だけでなく、ターゲットドキュメント内の任意の場所へのリンクを整理できます。

    XLSについては第10章で説明します。他のXMLアプリケーションはまだ準備ができておらず、本書では取り上げていません。 (XLinkとXPointerはInternet Explorer 5ではサポートされていません)。

    ご覧のとおり、XMLは文書を記述するための便利なツールであるだけでなく、インターネットの進化に伴って必要となる可能性があるアプリケーションや拡張機能を構築するための基盤としても役立ちます。

    実際のXMLの使い方

    XMLの概念は非常に興味深いものですが、それをどのように実践するのか不思議に思うかもしれません。 このセクションでは、広く使用されていると見込まれているこのXMLの使用例のリストを示します。 実用に適したXMLアプリケーションがある場合は、それらが括弧内に表示されます。 たとえば、MathML XMLアプリケーションを使用すると数学式をフォーマットできることがわかります。

    参照。 詳細な説明を含む、現在および将来のXMLアプリケーションのより完全なリストは、Oasis SGML / XML Webページ(http://www.oasis-open.arg/cover/ocml.HtmWアプリケーション)にあります。

    • データベースを操作します。 従来のデータベースと同様に、XMLを使用して各データベースレコード内の各情報フィールドにラベルを付けることができます。 その後、データをさまざまな方法で表示したり、検索、並べ替え、フィルタ処理、およびその他のデータ処理を整理したりできます。
    • 文書の構造化 XML文書の階層構造は、小説、科学作品、演劇などの文書の構造をマーキングするのに理想的です。 たとえば、XMLを使用して、演劇をシーン、シーン、キャラクターのマークアップ、ストーリー、装飾などにマークすることができます。XMLマークアップを使用すると、プログラムでドキュメントを必要な形式で表示または印刷できます。 文書内の情報を検索、取得、または操作する。 目次、要約、注釈を生成する。 他の方法で情報を処理します。
    • ベクトルグラフィック(VML - Vector Markup Language)を操作します。
    • マルチメディアプレゼンテーション(SMIL - 同期マルチメディア統合言語、HTML + TIME - HTMLタイミングインタラクティブマルチメディア拡張)。
    • チャンネルの説明 チャンネルは自動的に購読者に送信されるWebページです。 (CDF - チャンネル定義フォーマット)。
    • ソフトウェアパッケージとその関係の説明。 そのような記述はネットワークにおけるソフトウェア製品の配布と更新を提供します(OSD - Open Software Description)。
    • XML協調通信を使用したWebを介したアプリケーションの相互作用 これらのメッセージは、オペレーティングシステム、オブジェクトモデル、およびコンピュータ言語(SOAP - Simple Object Access Protocol)とは無関係です。
    • 電子名刺を電子メールで送信する。
    • 財務情報の交換 情報は、金融プログラム(QuickenやMicrosoft Moneyなど)と金融機関(銀行、公的資金)との間で、わかりやすくわかりやすい形式で交換されます(OFX - Open Financial Exchange)。
    • 商業用インターネットトランザクションのための複雑なデジタルフォームを作成、管理、および使用します。 そのようなフォームはそれらを合法的に認識させるデジタル化された署名を含むかもしれません(XFDL - Extensible Forms Description Language)。
    • 採用および再開要求の交換(HRMML - 人事管理マークアップ言語)。
    • で数式や科学情報をフォーマットする
    • Web(MathML - 数学マークアップ言語)。
    • 分子構造の記述(CML - ケミカルマークアップ言語)。
    • DNA、RNA、および鎖に関する情報のエンコードと表示(BSML - Bioinformatic Sequence Markup Language)。
    • 系譜データマークアップ言語(GeDML)コーディング。
    • 天文データの交換(AML - Astronomical Markup Language)。
    • 楽譜の作成(MusicML - Music Markup Language)。
    • 音声スクリプトを使用して電話で情報を配信します。 音声スクリプトは、たとえば、音声メッセージ、製品の入手可能性、および天気予報(VoxML)を生成するために使用できます。
    • 宅配便による情報の処理および配信。 たとえば、Federal Expressはすでにこの目的のためにXMLを使用しています。
    • デジタル形式での報道における広告の提示(AdMarkup)。
    • 法的文書の記入および法的情報の電子的交換(XCL - XML Court Interface)。
    • 天気予報コーディング(OMF - Weather Observation Markup Format)。
    • 不動産取引に関する情報の交換(RETS - Real Estate Transaction Standard)。
    • 保険情報の交換
    • オープンWeb標準(XMLNews)を使用してニュースや情報を共有します。
    • 宗教情報と礼拝のマークアップテキストの提示(ThML - 神学的マークアップ言語、LitML - 典礼的マークアップ言語)。

    XMLを理解するには、データにタグを付ける方法を覚えておくと便利です。 文書は何世紀にもわたって人々によって作成され、そしてこの間ずっと人々はそれらにメモを作った。 たとえば、教師は生徒の作品にメモを書き、段落の移動、文章の明確化、スペルミスの訂正などの必要性を指摘することがよくあります。文書内のメモを使用して、情報の構造、意味、外観を判断できます。 これまでにMicrosoft Office Wordでパッチを使用したことがあれば、メモを追加するためのコンピュータ化された形式に慣れています。

    情報技術の世界では、「マーク」という用語が「マークアップ」という用語になりました。 マークアップでは、タグ(またはトークン)と呼ばれるコードを使用して、構造、ビジュアルデザイン、そしてXMLの場合はデータの意味を定義します。

    この記事のHTMLテキストは、コンピュータマークアップの使用例です。 Microsoft Internet Explorerの場合は、このページを右クリックしてコマンドを選択します。 HTMLコードを表示するたとえば、読みやすいテキストとHTMLタグが表示されます。

    そして

    。 HTMLおよびXML文書では、タグは山括弧で囲まれているため、認識しやすいです。 この記事のソーステキストでは、HTMLタグは多くの機能を実行します。たとえば、各段落の始めと終わりを定義します。

    ...

      )と図面の位置。

    XMLの機能

    HTMLおよびXML形式の文書にはタグで囲まれたデータが含まれていますが、2つの言語間の類似性はそれだけで終わります。 HTML形式では、タグによってデータの外観(見出しの位置、段落の先頭など)が定義され、XMLでは、タグによってデータの構造と意味が定義されます。

    データの構造と意味を説明するとき、それらをいくつかの方法で再利用することが可能になります。 たとえば、各要素が明確に定義されている売上データのブロックがある場合は、必要な要素のみを売上レポートにロードし、その他のデータを会計データベースに転送できます。 つまり、1つのシステムを使用してデータを生成し、それらをXML形式でタグ付けしてから、クライアントプラットフォームやオペレーティングシステムに関係なく、このデータを他のシステムで処理することができます。 この互換性のおかげで、XMLは最も人気のあるデータ交換技術の1つの基盤となります。

    作業するときは、次の点を考慮してください。

      XMLの代わりにHTMLを使用することはできません。 ただし、XMLデータをHTMLタグでラップしてWebページに表示することはできます。

      HTML機能は、すべてのユーザーに共通の定義済みのタグセットに制限されています。

      XML規則を使用すると、データとその構造を記述するために必要なタグを作成できます。 ペットに関する情報を保存して共有する必要があるとします。 これを行うには、次のXMLコードを作成します。



      アイジー
      シャム人
      6
      はい
      いいえ
      Izz138bod
      コリン・ウィルコックス

    ご覧のとおり、XMLタグによって、表示しているデータが明確になります。 たとえば、これは猫に関するデータであり、名前、年齢などを簡単に判断できることは明らかです。ほぼすべてのデータ構造を定義するタグを作成できるため、XMLは拡張可能です。

    ただし、この例のタグとHTMLファイルのタグを混同しないでください。 たとえば、上記のXMLテキストをHTMLファイルに挿入してブラウザで開くと、結果は次のようになります。

    Izzyシャム6はいいいえIzz138bod Colin Wilcox

    WebブラウザはXMLタグを無視し、データのみを表示します。

    正しく形成されたデータ

    おそらく、ITプロフェッショナルの誰かが「整形式の」XMLファイルについて話しているのを聞いたことがあるでしょう。 整形式のXMLファイルは、非常に厳密な規則に従う必要があります。 これらの規則に従わないと、XMLは機能しません。 たとえば、前の例では、各開始タグに対応する終了タグがあるため、この例では、整形式XMLファイルの規則の1つに従います。 ファイルからタグを削除して、いずれかのOfficeプログラムでそのタグを開こうとすると、エラーメッセージが表示され、そのようなファイルを使用することはできません。

    整形式のXMLファイルを作成するための規則を知る必要はありませんが(理解するのは難しいことではありませんが)、整形式のXMLデータしか他のアプリケーションやシステムで使用できないことを忘れないでください。 XMLファイルが開かない場合、それはおそらく誤った形式です。

    XMLはプラットフォームに依存しません。つまり、XMLを使用するように設計されたプログラムは、ハードウェアやオペレーティングシステムに関係なくXMLデータを読み取って処理できます。 たとえば、正しいXMLタグを使用している場合は、デスクトップコンピュータのプログラムを使用して、メインフレームから受信したデータを開いて処理することができます。 また、誰がXMLデータを作成したかに関係なく、さまざまなOfficeアプリケーションでそれを使用できます。 その互換性のおかげで、XMLはデータベースとユーザコンピュータの間でデータを交換するための最も人気のある技術の1つになりました。

    タグ付きの整形式データに加えて、XMLシステムは通常、スキーマと変換という2つの追加コンポーネントを使用します。 次のセクションでは、それらがどのように機能するかについて説明します。

    スキーム

    「スキーム」という用語に怯えないでください。 スキーマは、XMLデータファイルの内容に関する規則を含む単なるXMLファイルです。 スキーマファイルは通常.xsd拡張子を持ちますが、XMLファイルはXMLデータファイルに使用されます。

    スキームにより、プログラムはデータを検証できます。 それらはデータの構造を形成し、作成者や他の人々への理解しやすさを保証します。 たとえば、ユーザーが日付フィールドのテキストなどの無効なデータを入力した場合、プログラムはそれを修正するように促します。 XMLファイル内のデータがスキーマ内の規則に準拠している場合は、XMLをサポートする任意のプログラムを使用してそれを読み取り、解釈し、処理することができます。 たとえば、次の図に示すように、Excelはデータを検証できます。    CATスキームに従って。

    スキームは複雑になる可能性があるため、この記事ではその作成方法を説明することは不可能です。 (さらに、ほとんどの場合、これを行う方法を知っている組織にITスペシャリストがいます。)ただし、ダイアグラムがどのように見えるかを知っておくと便利です。 次のスキームは、一連のタグの規則を定義しています。 ... :














    例がすべて明らかでない場合でも心配しないでください。 以下に注意してください。

      サンプルスキーマの文字列要素は宣言と呼ばれます。 動物の色や特別な特徴など、動物に関する追加情報が必要な場合は、ITスペシャリストがその計画に関連する発表を追加します。 ビジネスニーズが進化するにつれて、XMLシステムを変更することができます。

      広告はデータ構造を管理するための強力なツールです。 例えば、発表    のようなタグを意味する    そして   、上記の順序に従う必要があります。 広告を使用して、ユーザーが入力したデータの種類を確認することもできます。 たとえば、上記のスキームでは、猫の年齢に正の整数を入力し、ALTEREDタグとDECLAWEDタグに論理値(TRUEまたはFALSE)を入力する必要があります。

      XMLファイル内のデータがスキーマの規則に準拠している場合、そのようなデータは有効と見なされます。 スキームの規則によるXMLデータファイルの準拠性を制御するプロセスは、(論理的には)検証と呼ばれます。 スキーマを使用する大きな利点は、その助けを借りてデータの破損を防ぐことができることです。 スキーマを使用すると、破損したデータを見つけやすくなります。このような問題が発生すると、XMLファイルの処理が停止するためです。

    変換

    前述のように、XMLではデータの効率的な使用と再利用も可能です。 データの再利用メカニズムはXSLT変換(または単に変換)と呼ばれます。

    あなた(またはあなたのIT部門)は、変換を使用して、サーバーシステム間、例えばデータベース間でデータを交換することもできます。 データベースAでは、売上データが営業部門にとって便利なテーブルに格納されているとします。 データベースBは、会計用に特別に設計されたテーブルに収益と費用に関するデータを格納します。 データベースBは、トランスフォームを使用してデータベースAからデータを受け取り、それを適切なテーブルに入れることができます。

    データファイル、スキーマ、および変換の組み合わせによって、基盤となるXMLシステムが形成されます。 次の図は、そのようなシステムの動作を示しています。 データファイルは、スキームの規則に準拠しているかどうかが確認され、変換に適した方法で転送されます。 この場合、変換はデータをWebページのテーブルに配置します。

    次の例は、データをロードする変換を示しています。   Webページのスプレッドシートに。 この例の本質は、変換を作成する方法を説明することではなく、それらが取ることができる形式の1つを示すことです。
























    お名前 品種 年齢 変わった 宣言された ライセンス 所有者















    この例は、変換タイプの1つのテキストがどのように見えるかを示していますが、データから必要なものの明確な説明に自分自身を制限することができ、この説明はあなた自身の言語で行うことができます。 たとえば、IT部門に移動して、過去2年間に特定の地域の売上データを印刷する必要があるとしたら、この情報はこのようになるはずです。 その後、部門のスペシャリストがあなたの要求を満たすためにコンバージョンを書く(あるいは修正する)ことができます。

    マイクロソフトをはじめとする他の多くの企業がさまざまなタスクに対応するための変換を作成し、XMLの使用をさらに便利にしています。 将来的には、追加の設定や小さな変更を加えることなく、自分のニーズに合ったトランスフォーメーションをダウンロードできるようになるでしょう。 つまり、時間の経過とともにXMLの使用にかかるコストがますます少なくなるということです。

    Microsoft OfficeのXML

    Office Professional Editionは、包括的なXMLサポートを提供します。 Microsoft Office 2007以降、Microsoft OfficeはDOCX、XLSX、PPTXなどのXMLベースのファイル形式を使用しています。 XMLデータは特許取得済みのバイナリ形式ではなくテキスト形式で格納されているため、顧客は独自のスキーマを定義し、ライセンス料なしでさまざまな方法でデータを使用できます。 新しい形式の詳細については、「Open XML形式とファイル名拡張子」を参照してください。 その他の利点は次のとおりです。

    これはすべてすばらしいことですが、スキーマのないXMLデータがあるとしたらどうでしょうか。 どのOfficeプログラムを使用するかによって異なります。 たとえば、ExcelでスキーマのないXMLファイルを開くときは、そのスキーマが存在すると想定し、XMLテーブルにデータをロードできるようにします。 XMLリストとテーブルを使用して、データのソート、フィルタ処理、および計算を行うことができます。

    OfficeでXMLツールを有効にする

    デフォルトでは、[開発者]タブは表示されません。 OfficeでXMLコマンドを使用するには、それをテープに追加する必要があります。

    XMLは、データとは何かを考慮してデータを記述するために作成されました。

    HTMLは、表示されているデータがどのように見えるかを考慮してデータを表示するために作成されました。

    XMLとは

    • XMLはの略 Extensible Markup Language(拡張マークアップ言語)
    • XMLは マークアップ言語htmlに似ています
    • XMLはのために作成されました データの説明
    • XMLタグは事前定義されていません。 できます あなたのタグを使う
    • XMLの使い方 文書タイプ定義(DTD)定義  または xMLスキーマ(XML Schema)  データを説明する
    • XML w3Cが推奨

    XMLとHTMLの主な違い

    XMLはデータ転送用に設計されました。

    XMLはHTMLの代わりにはなりません。

    XMLとHTMLはさまざまな目的のために開発されました。

    • XMLはデータを記述するために作成され、どのデータが転送されるかに焦点を当てています。
    • HTMLは、データマッピングに重点を置いてデータを表示するように設計されています。
    • したがって、HTMLは情報の表示をより重視し、XMLは情報の記述です。

    XMLは何もしない

    XMLはアクションを実行するために作成されたのではありません。

    理解するのが難しいかもしれませんが、XMLはアクションを実行しません。 このマークアップ言語は、情報の構造化、保存、および送信用に作成されました。 次の例は、Anton IraによるXMLでのメモです。

    イラ

    アントン

    催促状

    今週のミーティングを忘れないでください。

    ご覧のとおり、XML言語は非常に簡潔です。

    メモ( )ヘッダーからなる )とコンテンツ( )手紙。 送信者が含まれています(タグ   - 「だれからの手紙」および受信者(タグ)   - 「誰に」)。 しかし、この手紙は何もしません。 これはタグで囲まれた純粋な情報です。 この情報を送受信し表示するためには、誰かがプログラムを書く必要があります。

    XML - Free Extensible Markup Language

    XMLタグは事前定義されていません。 あなたはあなたのタグを入力することができます。

    HTMLの文書のタグと構造はあらかじめ設定されています。 HTMLドキュメントの作成者は、標準で定義されているタグしか使用できません。

    XMLを使用すると、xml-documentの作成者にタグとドキュメント構造を入力できます。 例に示されているタグ(たとえば、   そして )XML標準では定義されていません。 これらのタグは文書の作者によって入力されます。

    XMLはHTMLを補完するものです

    XMLはHTMLに代わるものではありません。

    XMLはHTMLに代わるものではないことを理解することが重要です。 将来的には、Web開発者はXMLを使用してデータを記述し、HTMLはこのデータをフォーマットして表示するために使用される予定です。

    私のXMLに対する最良の定義は次のとおりです。XMLはクロスプラットフォーム、ソフトウェアおよびハードウェアに依存しない情報転送ツールです。

    注:  クロスプラットフォーム - あらゆるオペレーティングシステムおよびあらゆるハードウェアに適しています。

    ご存じの場合、おなじみのWindows以外にもさまざまなオペレーティングシステムがあります。 これはLinux OS、Macなどです。

    ハードウェアに関しては、次のように言うことができます:それは普通のPC、ラップトップ、ハンドヘルドコンピュータなどです。

    将来のWeb開発におけるXML

    XMLは至るところで使用されます。

    私たちはXMLが始まって以来、XMLの開発を目の当たりにしました。 XML標準がどれほど早く開発されたか、そして多くのソフトウェアベンダがこの標準をどれほど早く受け入れたかを見ることは驚くべきことでした。 私たちは、XMLがインターネットの基盤であるHTMLと同じくらいインターネットの将来にとって重要であること、そしてXMLがすべてのデータ操作と伝送のための最も一般的な道具であると確信しています。

    XML  手段 拡張マークアップ言語  を強調して マークアップ  (マークアップ) テキストを作成し、それをフレーミングタグでマークして、各単語、文、または文章を識別可能で分類可能な情報に変えることができます。 作成したファイル 文書のコピー要素(タグ)とテキストで構成され、紙の上で読むとき、あるいは電子形式でそれを処理するとき、要素は文書を正しく理解するのを助けます。 説明的な要素が多いほど、文書のより多くの部分を識別できます。 マークアップの最初の日から、その利点の一つは、コンピュータシステムが失われた場合、 データ  タグのおかげでまだ読める。

    マークアップ言語は、企業や政府機関によって作成された最初の形式から標準一般化マークアップ言語(SGML)、ハイパーテキストマークアップ言語(HTML)、そして最終的にはXMLに移行しました。 SGMLは複雑に思えるかもしれず、HTML(実際には、最初は単なる要素の集まりでした)は情報を識別するのに十分に強力ではありませんでした。 XMLは、使いやすく拡張しやすいマークアップ言語として開発されました。

    XMLでは、独自の要素を作成することができます。これにより、データを正確に表現することができます。 文書は段落と見出しだけでなく、文書内の断片を強調するためにも使用できます。 効果的であるために、あなたはあなたのアイテムの最終的なリストを決定してそれに固執する必要があります。 要素は、文書型定義(DTD)または以下で簡単に説明するスキーマで定義できます。 XMLを習得して使い始めたら、実際のファイルを作成しながら、要素の名前を試してみることを恐れないでください。

    XML文書を作成する

    すでに述べたように、XMLファイルはテキストとマークアップで構成されています。 テキストの大部分は、テキストがタグで囲まれている要素に配置されています。 たとえば、クックブックをXML形式で作成する必要があるとしましょう。 というレシピがあります アイスクリームサンデーXMLに変換します。 レシピの名前をマークするには、そのテキストをタグで始まりタグで終わる要素で囲みます。 この要素はrecipenameと呼ぶことができます。 要素の最初のタグをマークするには、その名前を山かっこで囲みます。<>)、このように:   。 それからアイスクリームサンデーというテキストを入力してください。 テキストの後に、次のように要素の名前の前に要素(/)を追加するためのスラッシュ(/)を付けて、終了タグ(要素の名前)を角括弧で囲みます。  。 これらのタグ形式 要素そこにはテキストや他の要素さえも入力できます。

    要素名は、個々の文書と文書のグループの両方に対して作成できます。 要件に応じて、要素に従わなければならない規則を指定できます。 要素は、厳密に特殊なものでも、かなり一般的なものでもかまいません。 規則は、各要素に含めることが許可されているものも定義する必要があります。 それらは、厳格、無料、または中級になります。 文書の重要な部分を定義する要素を作成するだけです。

    XMLファイルの作成を開始する

    XML文書の最初の行はXML宣言です。 このファイルのオプション部分ではXMLファイルとして定義されているため、自動化されたツールや人々はファイルをSGMLや他のマークアップ方法ではなくXMLとして認識することができます。

    宣言は単に次のようになります。   XMLバージョン(または )、さらには文字エンコーディング  Unicode用です。 この宣言はファイルの先頭に置く必要があるため、小さいXMLファイルを大きいファイルに結合する予定の場合は、このオプションの要素をスキップしてください。

    ルート要素を作成する

    ルート要素の開始タグと終了タグは、XML文書のテキスト全体を囲みます。 ファイルにはルート要素を1つだけ含める必要があります。これは、それに必要な "カバー"です。 ここでルート要素とともに使用する例の一部を示します   (レシピ) (完全なXMLファイルはにあります。)

    リスト1.ルート要素

    ドキュメントを作成するときに、テキストと追加のタグを間に配置します。   そして .

    アイテム名

    コンプライアンスをタグで登録

    XMLを作成するときは、開始タグと終了タグのレジスタが一致している必要があります。 そうしないと、XMLを使用または表示しているときにエラーメッセージが表示されることがあります。 たとえば、Internet Explorerは、レジスタが一致しない場合にテキストを表示しません。 代わりに、開始タグと終了タグの不一致に関するメッセージが表示されます。

    そのため、ルート要素があります。   。 XMLでは、まず要素名が選択され、次にこれらの名前に基づいて適切なDTDの説明またはスキーマが決定されます。 名前には、英字、数字、およびアンダースコア文字(_)などの特殊文字を含めることができます。 これは、名前について覚えておくべきいくつかの規則です。

    • 要素名にスペースは使用できません。
    • 名前は、数字や記号ではなく、文字で始める必要があります。 (この最初の文字の後には、文字、数字、および有効な文字の任意の組み合わせを使用できます。)
    • レジスタは関係ありませんが、混乱を避けるために注意してください。
    リスト2.その他の要素

    アイスクリームサンデー 5分

    XML文書には、開始タグと終了タグのペアではなく単一のタグで表すことができる空のタグが含まれている場合があります。 たとえば、これはスタンドアロンのHTMLスタイルのタグです。 子要素やテキストは含まれていないので、これは空の要素であり、(末尾にスペースとおなじみの末尾のスラッシュを付けて)と書くことができます。

    ネスティング項目

    添付ファイル- これは他の要素内の要素の配置です。 これらの新しい項目はと呼ばれます 所属している  要素、およびそれらを囲む要素 - それらの 両親  要素です。 ルート要素内   いくつかの項目を入れ子にしました。 これらはネストした子要素です。 ,   そして 内側の要素   同じ子要素がいくつかあります   。 添付ファイルはXML文書を多層化することができます。

    一般的な構文エラーは、親要素と子要素の入れ子に関連しています。 各子要素は、親要素の開始タグと終了タグの間に完全に配置する必要があります。 子要素は、次の子が始まる前に終了しなければなりません。

    正しい添付ファイルの例は、にあります。 タグの開始と終了なし 織る  他のタグと一緒に。

    リスト3. XML要素の適切な入れ子

    アイスクリームサンデー 3 チョコレートシロップまたはチョコレートファッジ 1 ナッツ 1 さくらんぼ 5分

    属性を追加する

    要素は時々追加されます 属性。 属性は名前と値のペアで構成され、値は二重引用符( ")で囲まれています。type =" dessert "。属性を使用すると、同じ文書内で要素ごとに値を変更できます。 。

    属性、あるいはいくつかの属性でさえも、要素の初期タグの内側に示されています。   。 複数の属性を追加する場合、それらはスペースで区切られます。   。 XMLファイルは現在の状態で表示されています。

    リスト4.要素と属性を含むXMLファイル

    アイスクリームサンデー 5分

    任意の数の属性を使用できます。 文書にどんな詳細を追加できるかを考えます。 属性は、文書が保管されている場合(例えばレシピのタイプごと)に特に役立ちます。 属性名には要素名と同じ文字を含めることができますが、スペースを除外する規則と名前の先頭に文字を付けるという規則は同じです。

    正しく構成されていないXML

    構造に定義されている規則に従えば、整形式のXMLコードを簡単に作成できます。 有効なxml- これは、すべてのXML規則(適切な要素の命名、ネスト、属性の命名など)に従ってコンパイルされたXMLコードです。

    XMLをどうするかによっては、整形式のXMLを扱う必要があるかもしれません。 レシピタイプによるソートの上記の例を考えてください。 要素が   含まれている属性タイプ。 コードを正常に検証し、この属性の値が常に存在することを確認できることが非常に重要です。

    検証中  これは、文書の構造が、その文書に対して確立されている規則および各親要素に対する子要素の定義への準拠についてチェックされることを意味します。 これらの規則は、 文書タイプの説明  (DTD)または方式で。 そのようなテストでは、DTDまたはスキーマを作成してから、XMLファイル内のDTDファイルまたはスキーマへのリンクを指定する必要があります。

    検証を有効にするには、XML文書の先頭近くに文書型宣言(DOCTYPE)を配置する必要があります。 この行には、このドキュメントを検証するために使用されるDTDまたはスキーム(要素と規則のリスト)へのリンクが含まれています。 DOCTYPE文字列は、とほぼ同じです。

    リスト5. DOCTYPE

    この例では、アイテムリストファイルの名前は filename.dtd  コンピュータに(つまり、PUBLIC共有ディレクトリにではなくSYSTEMディレクトリに)存在します。

    エンティティの使用

      エンティティテキストの断片や特殊文字にすることができます。 それらは文書の内側または外側に現れます。 誤りを避けそして表示の正確さのために、実体は適切に宣言され表現されるべきである。

    テキストに直接特殊文字を入力することはできません。 テキストで特殊文字を使用するには、それらを実体にしてこれらの文字のコードを使用する必要があります。 エンティティとして、会社名などのフレーズを定義してから、テキスト全体でそれらを使用できます。 エンティティを作成するには、エンティティに名前を付けてこの名前を挿入し、この名前をアンパサンド(&)の後のセミコロンで終わるテキストに挿入します。たとえば、&coname;のように入力します。 (または別の名前) 次に、のように角括弧()でDOCTYPE文字列にこのコードを入力します。 このコードは、エンティティの代わりに使用されるテキストを定義します。

    リスト6.エンティティ

    エンティティを使用すると、同じフレーズや情報が複数回繰り返されるのを防ぐのに役立ちます。 また、エンティティ定義文字列を設定するだけで、一度に多くの場所でテキスト編集を容易にすることもできます(たとえば、会社が名前を変更した場合など)。

    間違いを避ける方法

    XMLファイルの作成方法を学んでいる間に、それらが形式的に正しいこと、およびXML規則に従っていることを確認するためにXMLエディターでそれらを開きます。 たとえば、Windows®InternetExplorer®をお持ちの場合は、ブラウザでXMLファイルを開くことができます。 要素、属性、およびテキストが表示されていれば、XMLファイルは正しいです。 エラーがある場合は、おそらく構文が間違っていると思われるので、タグの誤りや句読点や句読点がないかどうかドキュメントを慎重に確認する必要があります。

    XML検証

    結論

    いくつかの簡単な規則を学んだので、あなたは柔軟にあなた自身のXML要素とそれらの属性を開発することができます。 XMLの規則は複雑ではありません。 XML文書を入力するのも簡単です。 主なことは、ソートおよび検索機能に関して文書から何を求めているのかを理解してから、これらの要件を満たすように要素と属性を開発することです。

テーマを続ける:
スマートテレビ

現在家電市場では、さまざまなテレビを見ることができます。 これらはさまざまな点で異なりますが、最も重要な違いの1つは画面の対角線です。 これで…