経済学者の職業活動における情報技術:それのITレビュー、運用上のデータ処理を目的としたもの。 オープンライブラリ - オープン教育図書館

知ってますか、 「物理的真空」の概念の虚偽は何ですか?

物理的な真空 - 相対論的な量子物理学の概念は、その下の量子化フィールドのより低い(基本的な)エネルギー状態があり、それはゼロのパルス、運動量のモーメント、およびその他の量子数を有する。 物理的真空相対論的理論者は、じれ不可能で満たされた物質空間を完全に欠けているので、虚数フィールドのみを呼び出します。 相対主義者の意見のこの状態は絶対的な空隙ではなく、特定のファントム(仮想)粒子で満たされたスペースです。 相対論的な量子場の理論は、Heisenbergの不確実性の原則と一致して、仮想仮想は常に物理的な真空で常に生まれていて、すなわち、一見した(だれが見える)、粒子:いわゆるゼロ電界変動が起こると主張する。 身体的真空の仮想粒子、したがって、定義によって彼自身が参照システムを持っていない、そうでなければ相対論の理論に基づくもの(つまり、可能な絶対測定システムがあるだろう)物理的な真空の粒子から読み、順番にサービスステーションのどちらの相対論の原則を確実に改義します。 したがって、物理的な真空とその粒子は物理的な世界の要素ではなく、現実の世界ではなく、相対論的処方の中でのみ、相対論的な式においてのみ、因果関係の原理を中断する(不要と消滅させる)。 、客観性の原理(仮想粒子、または既存の存在、または存在しない)の原理は、実際の測定可能性の原理(観察されない、ISOを持っていません)。

特定の物理学者が「物理的真空」の概念を使用するとき、彼はこの用語の不条理、またはLukuvitは、相対論的なイデオロギーの隠れているか明白な接着性であることを理解していません。

この概念の不条理を理解して、その出現の起源に連絡するのが簡単です。 それは1930年代にDirac分野であったが、それが素晴らしい数学者がしたように、エーテルの否認が純粋な形にあったことが明らかになったが、中程度の物理学者はすでに普通のものであった。 これが矛盾します。

相対主義を保護するために、Paul Diracは、亜鉛エネルギーのイネーションと類似の概念を導入し、次いで真空陽性とネガティブで互いに補償する2つのエネルギーの「海」の存在を導入しました。互いに対して - 仮想(すなわち、見かけ)電子および陽電子の真空中で。

州審査への質問

    ライフサイクルキス。 ライフサイクルキスの段階

    ライフサイクルシステムモデル(ビジネスアプリケーション)

    キティを作成する技術プロセス

    Life Cycle Kisをサポートするためのケースツール

    構造システム分析とデザインの方法と手段

    企業のシステムアーキテクチャの主な要素:ビジネスアーキテクチャ、情報アーキテクチャ、アプリケーションアーキテクチャ、技術アーキテクチャ

    企業情報システム 彼らの構造 キサの例

    情報アーキテクチャキス。 任命と構成 メソッドとデータアーキテクチャの説明

    企業の情報アーキテクチャを設計、開発、維持するためのツールキット

    企業の情報アーキテクチャにおけるアーキテクチャテンプレート(OLTP、OLAPシステム)

OLAPシステム

OLAP(ENG。オンライン分析処理、リアルタイム解析処理) - 多次元原理によって構成された大規模データアレイに基づく合計(集約された)情報の作成からなるデータ処理技術。 OLAPテクノロジの実装は、ビジネスインテリジェンスソフトウェアソリューションのコンポーネントです。

Olap - Edgar Coddの創設者は、1993年に「12の分析処理の法則をリアルタイムで」提案しました。

多くの場合、いくつかあります 情報システム - 倉庫会計システム、会計システム、個々の生産プロセスの自動化、会社部門を備えた報告システム、ならびにコンピュータコンピュータを介して散在している多くのファイル。

そんなに多数の情報源を持つ情報源を持つことが、当社の活動の主な問題に対する答えを得ることは非常に困難です。 そして希望の情報がまだ使用されているシステムのうちの1つにあるとき ローカルにファイルさまざまなシステムから得られた情報とは、しばしば古くなるか、または逆になることがわかります。

この問題は、OLAPテクノロジーズ(OLAPシステム、ビジネスインテリジェンスシステム、ビジネスインテリジェンス)に基づいて構築された情報および分析システムの助けを効果的に解決します。 OLAPシステムは、大量のリアルタイムデータ、動的レポート、監視、および主要なビジネスインジケータを分析するためのユーザーツールを提供している、既存のアカウンティングシステムを統合しています。

OLAPシステムの利点

会社の管理における重要な役割は情報を果たしています。 原則として、中小企業でさえも、さまざまな活動分野を自動化するためにいくつかの情報システムを使用しています。 従来のデータベースに基づく情報システムにおける分析レポートの取得は、いくつかの制限に関連しています。

各レポートの開発にはプログラマーの作業が必要です。

レポートは非\u200b\u200b常にゆっくり(しばしば数時間)、情報システム全体の作業を遅くします。

会社のさまざまな構造要素から得られたデータは統一されておらず、しばしば矛盾していません。

OLAPシステム、その構造の非常にイデオロギーは大量の情報を分析するように設計されており、従来の情報システムの制限を克服することができます。

企業内のOLAPシステムを作成することができます。

    真実の単一バージョンを作成することによってさまざまな情報システムからのデータを統合する

    プログラマーなしでいくつかのマウスクリックで新しいレポートを設計します。

    リアルタイムは、任意の詳細レベルでカテゴリとビジネスインジケータに関するデータを分析します。

主なビジネス指標の監視と予測

OLAPシステムを操作するときは、常に答えを見つけることができます、新たな質問、全体としての写真を参照して、ビジネスの様子を常時監視することができます。 同時に、関連情報のみを使用していることを確認できます。

OLAPシステムの実装結果

経営陣は、状況と会計管理、分析の単一のメカニズムの完全な明確なビジョンを取得します。

内部ビジネスプロセスの自動化と従業員の生産性の向上により、人的資源の必要性が低下しています。

OLAPアクション

クエリ処理にOLAPを使用する理由はスピードです。 リレーショナルデータベースは、通常、通常は正規化されている別々のテーブルに保存します。 この構造はデータベース(OLTPシステム)の動作に便利ですが、複雑なマルチクロック要求は比較的遅いです。

作業データから作成されたOLAP構造はOLAPキューブと呼ばれます。 キューブは、スターまたはスノーフレーク方式を使用してテーブル接続から作成されます。 スタースキームの中央には、要求が行われる重要な事実を含むファクトテーブルがあります。 ファクトテーブルに複数の測定テーブルが接続されています。 これらの表は、集約リレーショナルデータをどのように分析できるかを示しています。 可能な集計の数は、初期データが階層的に表示され得るメソッドの数によって決まります。

たとえば、すべての顧客は都市または国の地域(西、東、北、など)によってグループ化することができます。したがって、50の都市、8つの地域、および2カ国は60人のメンバーとの階層の3レベルになります。 また、顧客は製品に関して組み合わせることができます。 2つのカテゴリに250個の製品がある場合、製品の3つのグループと3つの生産単位がある場合、集約数は16,560です。スキームに測定を追加すると、可能なオプションの数が急速に数百万以上になる。

OLAPキューブには、基本データと測定情報(集計)が含まれています。 キューブには、任意の要求に対する回答に必要なすべての情報が含まれています。 凝集数の巨大な数のため、残りのために「オンデマンド」が残りのために行われます。

基本概念と一緒に、3種類のOLAPがあります。

多くの測定値(多次元OLAP - MOLAP)を伴うOLAP。

リレーショナルOLAP(ROLAP);

ハイブリッドOLAP(ハイブリッドOLAP - HOLAP)。

MOLAPは古典的なOLAP形式であるため、それは単にOLAPと呼ばれることが多いです。 それは、Spatialデータベースプロセッサの特別バージョンのサミットデータベースを使用し、基本データと集計の両方を保存して必要な空間データ方式を作成します。

ROLAPはリレーショナルストレージで直接動作します。ファクトテーブルと測定テーブルはリレーショナルテーブルに格納され、追加のリレーショナルテーブルがユニットを格納するために作成されます。

HOLAPは、基本的なデータと集約のための多次元表を格納するためのリレーショナル表を使用します。

ROLAPの特別なケースはROLAPリアルタイム(リアルタイムROLAP - R-ROLAP)です。 R-ROLAPのROLAPとは異なり、集計を保存するために追加のリレーショナルテーブルが作成されず、その要求時に単位が計算されます。 この場合、OLAPシステムへの多次元要求は自動的にリレーショナルデータへのSQL要求に変換されます。

各種類のストレージには特定の利点がありますが、異なる製造業者からの評価には対応があります。 小さなデータセットに最適で、集計をすばやく計算し、答えを返しますが、膨大なデータ量が生成されます。 ROLAPは、可能な限り最小のスペースを使用するよりスケーラブルな解決策として推定されます。 この場合、処理速度は大幅に低減されます。 HARAPはこれら2つのアプローチの真っ只中にあり、それはよく縮小され、すぐに処理されています。 R-ROLAPアーキテクチャは、リアルタイムで多次元OLTPデータ解析を可能にします。

OLAPの適用の複雑さは、クエリ、基本データの選択、およびスキームの開発を作成することであり、その結果、最新のOLAP製品のほとんどに膨大な数の事前設定されたクエリが付属しています。 もう1つの問題は基本的なデータです。 彼らは完全で一貫していなければなりません

販売オラプズ

歴史的に、最初の多次元データベース管理システムは、本質的にOLAPの実装であることは1970年にIRIによって開発されたExpressシステムです(後で製品の権利はOracle Corporationによって購入され、OracleデータベースのOLAPオプションに変えました)。 OLAPという用語は、1993年にコンピュータワールドの出版物でEDGAR CODDを導入した。これにより、提案されたリレーションデータベースのための12の規則と同様に、プロジェクトを満たす参照製品として、分析処理の原則のうち12の原則が提案されました。原則、コードはARBORのESSBASEシステム(1997年はHyperionによって吸収され、それが2007年にOracle)を購入しました。 その後、符号は後でarborのコンサルティングサービスを提供しているため、その後、興味のある矛盾があるため、コンピュータワールドアーカイブから引き出されたことは注目に値します。

その他の有名なOLAP製品:Microsoft Analysis Services(以前はOLAPサービス、パートSQL Serverと呼ばれる)、SAS OLAP Server、TM1、PowerPlay、SAP BW、MicroStrategy Ingelligence Server、Mondrian、Analytical Complex予測。

c実装ポイントは、「物理OLAP」と「Virtual」(リレーショナル、英語リレーショナルOLAP、ROLAP)に分けられます。 実装に応じて、「物理」は、多次元(多次元OLAP、MOLAP)およびハイブリッド(Hybrid Olap、Hoarap)に分けられます。

最初のケースでは、ソースからOLAPのプリローディングステージで、集計の予備計算(たとえば、いくつかのソース値の計算、たとえば「1ヶ月の計算」)があり、その後に保存されます。高速抽出と費用対効果の高い記憶装置を提供する特別な多次元データベース そのような製品の例は、Microsoft Analysis Services、Oracle OLAPオプション、ESSBase、SAS OLAP Server、TM1、PowerPlayです。

ハイブリッドOLAPは組み合わせです。 データ自体はリレーショナルデータベースに格納され、集計は多次元的にあります。

ROLAP実装では、すべてのデータが格納され、リレーショナルデータベース管理システムによって処理され、DBMSまたはAnalyticalソフトウェアのキャッシュ内の最初のリクエストですべてが存在しない、または作成できます。 そのような製品の例 - SAP BW、MicroStrategy Intelligence Server、Mondrian。

ユーザーの観点からは、すべてのオプションが機能のようになります。 財務計画、データウェアハウス、ビジネスインテリジェンスクラスソリューションのための製品でのOLAPの最大の使用。

オルリーtPシステム(トランザクション処理システム)

OLTP(オンライントランザクション処理)、トランザクションシステム - リアルタイムトランザクション処理。 システムが小さなトランザクションで機能しているが大幅なストリームに移動するデータベースを整理する方法、および同時に、クライアントはシステムから最小応答時間を必要としています。

OLTPという用語はシステム(アプリケーション)にも適用されます。 OLTPシステムは、リアルタイムで情報(操作、文書)の情報(操作、文書)の入力、構造化された記憶および処理を行うように設計されています。

整合性の問題は、いつでもデータベースデータの正確さを確実にすることです。 TRAREに分割することができます.1。誤った情報が適用されると、入って更新するとき。 2.データが複数のユーザーを同時に使用すると。 3. APS障害で。

完全性の問題を解決すると、ソフトウェアと組織の観点から考慮されるべきです。 課題1.多くのイベントオーガナイザー(次のように入力)が必要です。ユーザーは入力と制限の規則を知っているはずです。 問題のために2-3 - 標準はDBMSまたは特別なソフトウェアモジュールを意味します。 DBMS - 2基本的な整合性の制限事項:1。構造の制限事項(機能債券によって定義され、データベース値の平等を確認することによってチェックされます)2。実際の値の制限事項。 フィールド値をいくつかの範囲に属しているか、またはいくつかのフィールドの値の間のこの関係が必要です。 (データ型と入力マスク)。 制限はいつでもADによって設定できますが、DBMSは制限を受け付けない場合があります(たくさんのレコードが満たされなくなった場合)、コンプライアンスがある場合は辞書に書き込まれて使用されます。 制限は複雑さの点で異なります。

2.文字列の属性のセットを制限します。 (位置 - 放電速度、エッジ都市)。

3.多くの行に同時に制限されています。

これらすべての統計的制限が、データベースを1つの状態から別の状態に切り替えるときは、すべての変更前とすべての終了後に完全性の制限を満たす必要があります。 そのような制限は延期され、それらに対して相対的なトランザクションの概念を導入しました。 トランザクション - データベース上のUSSerアクションの観点から完了しました。 同時に、これはシステムの論理単位です。 トランザクションは、例えば、銀行システム内の別のアカウントから別のアカウントへのお金を転送するなど、いくつかのアプリケーション機能を実装しています。

4つのプロパティが必要です:1。原子性(不可分性):データベースへのアクセスの1回の操作として実行され、完全に実行されていなければならない。 2.一貫性 - 取引処理終了後に相互データの整合性を保証します。 3.分離(各トランザクションはこれを変更できます。これは一時的に矛盾しない状態にあります)。 この場合、トランザクションが完了するまで、これらのデータへの他のトランザクションのアクセスは禁止されています。 4.耐久性 - トランザクションが成功した場合、変更は失われません。 トランザクションの結果は、その固定(データベースの変更の修正時のアクション)またはロールバック(トランザクションのキャンセルとデータベースの開始前の状態へのデータベースの返却)です。 固定機構とロールバックは、状態が前後(複数回の反復)と後に保持されているトランザクションログの使用に基づいています。 一部のSQL方言には、中間固定演算子(ポイントツーポイントからポイントへのロールバック)が含まれます。

トランザクション処理モニタモニタ(TPM)はソフトウェアシステム(仲介ソフトウェアまたは中間ソフトウェアを参照)で、情報の効果的な管理のタスクを分散システム内の情報とコンピューティングリソースを解決します。 それらは、分散トランザクションの運用処理に焦点を当てたモバイルアプリケーションを開発および管理するための柔軟でオープンな環境です。 TPM - スケーラビリティの最も重要な機能の中で、機能的な完全性とアプリケーションの完全性をサポートし、低コストインジケータでデータを処理するときに最大の性能を達成し、異種環境でのデータの整合性をサポートします。 TPMは3席モデル「クライアント - サーバ」に依存しています

現在の取引モニターの市場では、主な「作業者」は、ACMS(DEC)、CICS(IBM)、トップエンド(NCR)、Tuxedo Sytem(Novell)などのシステムです。

データを共有する

トランザクションを実装するときに問題が発生します。更新の喪失(1人のユーザーの変更のみがデータベースに記録されているため、残りは失われます)。 そして2つの問題 - ロック解除されたデータの読み取り。 解決するために - 特別なトランザクション処理メカニズム。 原則:1。トランザクションは、undiledデータへのアクセス権はありません。 2.トランザクションの共同実行の結果は、それらの最新の履行に相当\u200b\u200bします。 このメカニズムはブロッキングシステムを介して実装されています。DBMSはデータベースの一部、トランザクションがその固定の瞬間に描画されます。 2番目のトランザクションは待機中のキューになければなりません。 ブロッキング可能な項目が大きいほど、トランザクションが遅くなります。 OLTPシステムでは、文字列がブロックされ、トランザクションは相互ブロッキングの状況に入ることができます。 DBMSが定期的にブロックされているのを防ぐために、それがその1つのトランザクションが中断されます。 より便利な操作のために、ブロッキングデータ共有は許可されています:ワーキングUSRAと並行してデータを変更することは禁止されていますが、それらのサンプルは許可されています。 このアプローチは、たとえば、配信システムを持つシステムでのデータ複製を使用しています。 このテクノロジは、データ配信の拒否、および各ノードのデータベースの独自のコピーを意味します。 これを提供することを意味し、コピー変更を伴う一貫したデータベース状態を維持する必要があります。 個々のノードのデータベース内の初期データベースの変更を転送するプロセスは、データ複製と呼ばれます。 これらの機能は特定のモジュール(サーバー循環/複製器)を実行します。 その作業のスキームは、データベースの内容を完了することです。 リモートサーバー (フルアップデートによる方式)または変更データのみを更新する(クイックアップデート方式)データを常に更新する必要がない場合、レプリケータは変更を累積し、適切なタイミングでコピーされます。

OLTP - オペレーショナルトランザクション処理システムは、同じデータを参照して、さまざまなユーザーが同じデータを参照して、データを読み取り、書き込み、削除、または変更することによって特徴付けられます。 複数のユーザの通常の動作のために、閉塞およびトランザクションが使用される。 効果的なトランザクション処理とブロックサポートは、トランザクション処理システムにとって最も重要な要件の1です。

現代データベース技術は、建築の分野に特定の要件を課します。 最近まで、3つのクラスのタスクが割り当てられていました。

    運用トランザクション処理のタスク

    パケット処理タスク

    意思決定タスク

OLTPシステム - トランザクション運用システム そのようなシステムの主な機能は同時に実行されます。 多数 多数のユーザーからの短いトランザクション。 トランザクション自体は比較的簡単に見えます。たとえば、「アカウントAからの金額を削除するには、この金額をinに追加します」。 歴史的に、そのようなシステムは、会計、サービス速度、データ収集などの必要性を実装しているため、まず最初に発生しました。

OLTPシステムは次のように特徴付けられます。

    多数のユーザーをサポートします。

    要求への小さな応答時間。

    比較的短いクエリ。

    短いトランザクション。

    少数のテーブルの要求への参加。

OLTPシステムのデータベースへのほとんどすべての要求は、挿入、更新、削除から構成されています。 サンプルのクエリは主に、さまざまな参照ブックから選択する機能をユーザーに提供するように設計されています。 したがって、ほとんどの要求は、システムの設計段階で事前に知られています。 したがって、OLTPアプリケーションにとって重要なのは、短いデータ更新操作の実装の速度と信頼性です。

トランザクション操作サーバーは次のものに基づいています。

    OLTP操作は多数のユーザーをサポートしています。

    最も一般的に使用される短い単純な取引。

    通常、トランザクションは同じデータを使用しません。

    オペレータは通常少数の行に影響します。

    応答時間 - 2分割。

    いくつかのテーブルだけを持っています 大型サイズ または変更することがあります。

そのようなサーバーの実装は次のものに基づいています。

    ディスク操作を切断する物理的方法

    メモリ内の少量のデータを処理する。

    プリミティブクエリオプティマイザ。

申請要件は、リソースとデータの使用における競争を排除することです。

    データウェアハウスとデータマイニング

データマイニングは「マイニング」または「データ掘削」として変換されます。 多くの場合、データマイニングの隣には「データベースにおける知識に関する知識」と「インテリジェントデータ分析」という言葉があります。 データマイニングと同義語と見なすことができます。 これらすべての用語の出現は、資金およびデータ処理方法の開発における新しいターンに関連しています。

1990年代初頭まで、この地域の状況を再考する特別な必要性がないと思われました。 適用された統計と呼ばれる方向の一部として、すべてが女性として行った(例えば、参照)。 理論学は、会議やセミナーを実施し、分析計算により展開した印象的な記事やモノグラフを書いた。

同時に、実務家は、ほとんどの場合、実際の問題を解決するために理論的な演習を適用しようとする試みが常に知っていました。 しかし、実務者の懸念については、特別な注意を払わないことは可能でした - 彼らは小さなローカルデータベースを処理するための彼らの個人的な問題を解決しました。

そして電話が鳴った。 人々にデータを記録および保存するための技術の改善に関連して、様々な分野における巨大な情報鉱石の流れはコロッシングされていた。 企業の活動(商業、工業用、医療、科学など)は現在、その活動の詳細の登録と記録を伴う。 この情報をどうするか? 生産的な処理がなければ、生データの流れは誰もいない埋立地を形成していないことを明らかにしました。

そのようなリサイクルのための現代要件の特異性は以下の通りです。

    データは無制限のボリュームを持っています

    データは不均一(定量的、高品質、テキスト)です

    結果は特定され理解できなければなりません。

    生データを処理するためのツールは使いやすくなければなりません。

伝統的な数学統計は長い間、データを分析するための主要なツールを主張して、問題に直面して逃げ出しました。 主な理由は、サンプル上での平均化の概念であり、架空の価値観(病院内の患者の平均温度、宮殿やシャックなどからなる路上の家の中央の高さなど) 。 数学的統計の方法は、主に事前策定された仮説(検証駆動データマイニング)および操作上の分析データ処理の基礎を構成する「粗い」探査分析(オンライン分析処理、OLAP)をチェックすることを主に有用であった。

現代の技術データマイニング(発見駆動データマイニング)の基礎は、データ内のマルチスケール関係のフラグメントを反映して、テンプレートの概念(パターン)に基づいています。 これらのテンプレートは、クリアマニュアルでコンパクトに表現できるサブセクションデータに固有の規則性です。 テンプレートの検索は、サンプルの構造に関する先験的な仮定の枠組みと分析された指標の値の値の形式の形式に限定されない方法によって行われます。 データマイニングを使用するときのこのような検索のタスクの例は表にあります。 1。

データマイニングの重要な位置は、募集テンプレートの些細なことです。 これは、見つかったテンプレートが、いわゆる隠された知識を構成するデータにおいて、非明白で予期せぬ(予期せぬ)規則性を反映することを意味します(隠れた知識)。 社会は、生データ(生データ)が深い知識層を含み、その実際のナゲットが検出される可能性があることを認識していることを理解するようになりました(図1)。

図1.データから取得された知識のレベル

一般的に データ技術 鉱業は間違いなくGrigory Piatetsky-Shapiro - この方向の創設者の1つを決定します。

データマイニングは、以前に未知の、非些細な、実質的に有用で有用であり、人間の活動の様々な分野で決定を下すのに必要な知識の手頃な価格の解釈の生データの検出プロセスです。

誰がそれを必要としますか?

データマイニングの範囲は何に限定されません - それはデータがある場所にあります。 しかし、まず第一に、今日のデータマイニング方法で、それを穏やかに、興味をそそらせた商業企業、データ格子に基づくプロジェクトを展開します(データウェアハウス)。 そのような多くの企業の経験は、データマイニングの使用の収益が1000%に達することができることを示しています。 たとえば、経済効果の報告は、350から750千ドルまでの最初の費用の10-70倍です。 。 わずか4ヶ月で支払われた2000万ドルのドラフトに関する情報があります。 もう1つの例は、700千ドルの年間節約です。 イギリスのユニバースネットワークでデータマイニングを実施することによって。

データマイニングは、日常活動のマネージャやアナリストにとって大きな価値があります。 ビジネスの人々は、データマイニング方法の助けを借りて、競争の激しい闘争で具体的な利点を得ることができます。 いくつかの可能なビジネスアプリケーションのデータマイニングを簡単に説明します。

または

データ。鉱業

現代の企業の企業データベースには、通常、特定の事実やオブジェクトに関する録音を格納する一連のテーブルが含まれています(たとえば、商品、販売、顧客、顧客、口座について)。 原則として、類似のテーブルの各エントリは特定のオブジェクトまたは事実を表しています。 たとえば、セールステーブルのレコードは、そのような製品がそのようなクライアントに販売されているという事実を反映しています。その場合は、マネージャーのようなもの、および大きく、この情報には含まれていません。 ただし、数年間にわたるそのようなレコードの総数は、1つの特定のレコード、すなわちパターン、傾向、またはデータ間の相互依存性に関する情報に基づいて得られない追加の、はるかに貴重な情報の源となる可能性があります。 そのような情報の例は、特定の製品の販売が曜日、日またはシーズンの日にどのように依存しているかについての情報であり、そのカテゴリーのカテゴリーが最も頻繁に1つまたは別の製品を取得します。製品は別の特定の製品を取得し、そのカテゴリーのカテゴリーが最も頻繁には時間内にローンを与えない。

そのような情報は一般的に予測、戦略的計画、リスク分析、そして企業のその価値は非常に高く使用されています。 したがって、その検索のプロセスと名前データマイニングのプロセス(英語の採掘は「マイニングマイニング」を意味し、実際のデータの巨大なセットの規則性の検索は本当にこれに似ています)。 データマイニングという用語は、さまざまな数学的および統計的アルゴリズムを通じて相関、傾向、関係、およびパターンを見つけるプロセスとして、それほど特定の技術を意味します。クラスタリング、サブ発見、回帰、および相関分析の作成。 この検索の目的は、明らかに反射的なビジネスプロセスの形でデータを提出すること、およびモデルを構築することであり、これはあなたが事業計画にとって重要なプロセスを予測することができます(たとえば、特定の商品やサービスの需要のダイナミクスなど)。またはその消費者特性からの彼らの買収の依存関係)。

伝統的な数学統計、長期にわたるメインデータ分析ツール、ならびに運用分析データ処理ツール(オンライン分析処理、OLAP)は、繰り返し書いています(私たちのCDでこのトピックの資料を参照)、それそのようなタスクを解決するために常に適用されることは必ずしも可能ではありません。 典型的には、統計的方法およびOLAPは、予め定式化された仮説をチェックインするために使用される。 しかし、データ内のすべてのパターンからはるかに一目で明らかであるため、仮説の表現はその後の意思決定のためのビジネス分析の実現における最も困難な課題であることが多い。

OLTPおよびOLAPシステム。 データマイニング。

いくつかのクラスの情報システムを区別することができ、そのために正規化されたデータモデルはより弱いものである。

強く正規化されたデータモデルはいわゆるものによく適しています OLTPシステム (オンライントランザクション処理 - 取引の運用処理).

OLTPシステムの典型的な例は、倉庫会計システム、発券システム、お金の譲渡のための取引を行う銀行システムなどです。 そのようなシステムの主な機能は、多数の短絡を実行することです 取引。 取引メカニズムは、仕事の原則を理解するために、詳細講義16で検討されます。 OLTPシステムデータベース状態を変更するアトミックアクションとしてトランザクションを表現するのに十分です。

OLTPのトランザクション - システムは比較的簡単です。たとえば、「アカウントAからの金額を削除し、この金額を勘定に追加する」ということです。 問題は、まず、たくさんのトランザクションがあることが、同時に実行され、同時に実行されます(複数の同時に操作ユーザーをシステムに接続できます)、3番目に、エラーが発生した場合、トランザクションは完全にロールバックする必要があります。そして、取引の開始前の状態にシステムを返却します(勘定aから、お金が取り除かれたときに状況はありませんが、アカウントBに到着しませんでした)。

OLTPアプリケーションでのデータベースへのほとんどすべての要求は、コマンドの挿入、更新、削除で構成されています。 サンプルのクエリは主に、さまざまな参照ブックから選択する機能をユーザーに提供するように設計されています。 ほとんどの要求はシステム設計で事前に知られています。 したがって、OLTPアプリケーションにとって重要なのは、短いデータ更新操作の実装の速度と信頼性です。

これに関連して、OLTPアプリケーションが機能するデータベースは常に更新されています。 運用データベース オペレーショナルデータベースの正規化のレベルが高ければ高いほど、より高速で確実にOLTPアプリケーションを動作させます。 この規則からの後退は、関係の関係とアプリケーションの態度の開発に関するアプリケーションの操作を必要とする頻繁に発生する要求があるときに発生する可能性があります。 この場合、このような要求の実行をスピードアップするために、データベースに冗長性を意識的に行うことができます。

別の種類の情報システムはいわゆる OLAPシステム (オンラインの分析処理 - 運用分析データ処理)。 OLAPは管理ソリューションを受け入れるために使用されるため、OLAPテクノロジを使用するシステムが呼び出されます。 意思決定支援システム (意思決定支援システム - DSS).

OLAPの概念は、リレーショナルデータモデルの作成者であるEdgar Coddoによって1993年に説明されていました。

1995年に、コードによって設定された要件に基づいて、いわゆる fADMI(共有多次元情報の高速分析) - 多次元分析アプリケーションのための以下の要件を含む共有多次元情報の迅速な分析:

・少なくとも詳細な分析が少なくても、許容時間(通常5秒以下)の分析の結果をユーザーに提供する。

・本出願に特徴的な論理的および統計分析の実現と使いやすい形式での節約を実現する能力。

・対応するブロッキングメカニズムおよび許可されたアクセサリのサポートによるマルチユーザーデータアクセス。

・階層や複数の階層のフルサポートを含む、データの多次元概念表示(これは重要な要件OLAP)です。

・そのボリュームおよび保管場所に関係なく、必要な情報を参照する機能。

OLAPアプリケーションは、スプレッドシートからまたは他のデータソースから撮影されているOLTP演算データベースにすでに蓄積されている大きなデータアレイで動作します。 そのようなシステムは以下の特徴によって特徴付けられる。

・システムへの新しいデータの追加は比較的めったに大きいブロックです(たとえば、OLTPシステムの四半期販売のデータがダウンロードされます。

・システムに追加されたデータは通常削除されずに変更されません。

・データをロードする前に、さまざまな送信フォーマットを持つ多くのソースからのデータを1つのシステムに含めることができるという事実に関連して、さまざまな「クリーニング」手順が渡されます。データは正しくない場合があります。

・システム要求は選択されておらず、原則として、非常に複雑です。 非常に頻繁に新しい要求がアナリストによって定式化され、前の要求の結果として得られた結果を明確にします。

・リクエストの実行速度は重要ですが、重要ではありません。

OLAPシステムのリストされている特徴に基づいて、そのようなシステムのデータベースは大規模に非正規化され得ると結論付けることができる。 データベースクエリのメインタイプは選択するクエリであるため、正規化の前向きなモーメントを使用できません。また、リクエストでの接続操作の低下は非常に役立ちます。

最近 分析データ処理の他の方向は積極的に発展している。 データマイニング(データの理解、「データの発掘」と言うことがある)。 この方向は、データ内の隠れたパターンを検索したり、予測タスクを解くことを目的としています。 データ管理アプリケーションでは、それらが機能するデータも変更しないので、非正規化データベースがより好ましい。

OLAPおよびデータマイニングアプリケーションを分析するために効果的に使用できるデータを整理するための特別な方法を強調するために、それらはそれらに特別な用語を使用します。 「データウェアハウス」(データウェアハウス))。 運用データベースとは対照的に、データウェアハウスは、履歴データを格納することに注意することが重要です。 したがって、すでに発生している企業の活動からの事実を反映しているため、一定の形式(「物語は書き換えない」)に保存し、長年にわたって蓄積することができます。したがって、それらのサイズは非常に印象的になる可能性があります。 リポジトリ内のデータをポンピングした後、それらは通常、そのサイズを維持することができるように、それらは通常動作データベースから削除されます。

以前のサブセクションでは、対象地域の適切な表現のために、データベースの開発および維持のシンプルさを簡単にするために、その関係は第3の通常の形式に与えられるべきであることに留意されたい(正規化およびより高い注文の形態があるが、実際には、それらは非常にめったに使用されません)、つまり強い正規化されています。 同時に、弱い正規化された関係にもそれらの利点があり、その主な主なものは、データベースが主に要求だけで適用された場合に適用され、そして非常にめったに行うためのデータを追加し、それらのサンプルがはるかに速くされます。 これは、弱めに正規化された関係では、それらの組み合わせの組み合わせが既にあり、これはプロセッサ時間に費やされないという事実によって説明されます。 正規化関係がより十分かつ弱いシステムの2つのクラスが区別されています。

強く正規化されたデータモデルはOLTPアプリケーションに最適です - オンライントランザクション処理 (OLTP) - アプリケーショントランザクションの運用アプリケーション。 OLTPアプリケーションの典型的な例は、倉庫会計システム、運用銀行システムなどです。 そのようなシステムの主な機能は、多数の短いトランザクションを実行することです。 トランザクション自体は非常に簡単ですが、そのようなトランザクションが非常に多くあるという問題は、同時に実行され、トランザクションが発生すると、トランザクションの前の状態にシステムをロールバックして戻す必要があります。 OLTPアプリケーションでのほとんどすべてのデータベース要求は、コマンドの挿入、更新、削除から構成されています。 サンプリング要求は主に、さまざまな種類の参照書からユーザーサンプリングユーザーを提供することを目的としています。 τᴀᴋᴎᴍᴀᴋᴎᴍᴏϭᴩᴀᴈᴏᴍは、大部分の要求がシステム設計で事前に知られています。 OLTPアプリケーションにとって重要なのは、短いデータ更新操作の実装の速度と信頼性です。 OLTPアプリケーションでのデータ正規化のレベルが高いほど、より速く、より信頼性が高くなります。 この規則からの退却は、関係の組み合わせとこの規則の開発に関するアプリケーションの操作を必要とする頻繁に発生する要求があるときに発生する可能性があります。

別の種類のアプリケーションはOLAPアプリケーションです - オンラインの分析処理 (OLAP) - 運用分析データ処理の適用 これは、意思決定支援システム(DSS)、データウェアハウス - データウェアハウス、データインテリジェントシステム - データマイニングの原則を特徴付ける一般的な用語です。 そのようなシステムは、データ間の依存関係を見つけるように設計されており、「... ...」の原則と尤度の原理についての動的分析のために設計されています。 OLAPアプリケーションは、企業に蓄積されているか、他のソースから取得された大規模なデータアレイで動作します。 そのようなシステムは以下の特徴によって特徴付けられる。

新しいデータのシステムに追加すると、例えば月または四半期には、比較的めったに大きなブロックが発生しません。

システムに追加されたデータは通常削除されません。

ダウンロードする前に、データを定義されたフォーマットに持つことに関連したさまざまな準備手続きを受けます。

システム要求は選択されていないかつ非常に複雑です。

クエリの速度は重要ですが、重要ではありません。

ベース データOLAP。- アプリケーションは通常1つ以上のハイパーキューブとして表され、その測定値は参照データであり、ハイパーキューブ自体のセルではこれらのデータの値が格納されます。 物理的には、特別な多次元データモデルに基づいてハイパーキューブを構築することができます。 多次元オラプス (MOLAP)またはリレーショナルデータモデルによって表される - リレーショナルOLAP。 (ローラップ)。

リレーショナルデータモデルを使用したOLAPシステムでは、データは事前\u200b\u200b計算された主要な最終データを含む不十分な正規化関係として格納されることを意図しています。 データの冗長性とそれに関連する問題は、ここではまったくまれであり、結果がデータ更新と一緒に再計算されるため、ここではひどくはありません。


  • - 給水システムの信頼性を確保する方法

    給水システムの信頼性とその他のシステムの信頼性を確保する マスサービス彼らがデザインしたときの主な仕事の1つです。 システムは指定された操作の過程で指定された機能を実行するように設計および構築されなければなりません... [続きを読む]


  • - I.保護システムセキュリティの概念

    開発されているシステムのセキュリティの概念は、「この一連の法律、規則および規則および規範の規定の規定の定義、組織のプロセス、保護および配信方法を定義します。 特に、ルールは、ユーザーが操作権を持っているという事実を決定します... [続きを読む]


  • - 暖房システムの設計上の主な決定を下した後

    給湯システムの設計。暖房システムを開閉回路で接続するときにサーマルノードスキームに指示してください。 いくつかの建物の熱供給による自己試験のための質問。 ポンプやその他の機器が設置されています... [続きを読む]


  • - 防火システムの火災安全要件

    技術プロセスの火災安全性を確保するための基礎。 質問2.オブジェクトの外国の防止(25分)防火防止には、人々の安全性を確保することを目的とした組織的および技術的措置の複合が含まれています。


  • - 動物臓器の織物と器官

    動物織物 動物はまた、いくつかの種類の組織を区別します。 それらの最も重要なことは以下の通りです。 上皮ナチュレッツは、肝臓、肺、腺の一部である内部キャビティと臓器を覆う、外側の体を覆っている境界線織物です。

    より高い真核生物のゲノムにおいて、多数の反復DNA配列がある。 例えばヒトにおいて、そのような繰り返しは全ゲノムの40%を超えることを占める。 そしてこれは、DSBを形成するときに、いくつかのギャップの同時教育の可能性を意味する... [続きを読む]


  • - Avo Zolloni Anti-A、抗Vおよび抗AVのシステムの血液群の定義

    血液群の定義この規則によると、すべての患者は凝集体を含まないので、群の血液O(1)を溢れさせることができ、他のグループのグループは他のグループのバンドを溢れさせることができます。凝集子 したがって、概念が紹介されています...

  • 短所
    OLTPシステムは小さなディスクリート取引に最適化されています。 しかし、いくつかの包括的な情報(特定の分岐における特定の商品の販売数量の四半期ごとのダイナミクスなど)、分析アプリケーション(OLAP)の特徴は、複雑なテーブル接続とテーブルを完全に表示することです。 そのような要求の1つは多くの時間とコンピュータリソースを取ります。これにより、現在のトランザクションの処理が遅くなります。

    トランザクションクラクション(英語トランザクション)は、データを含む論理的な作業単位である連続した操作のグループです。 トランザクションは、完全かつ正常に実行され、データの完全性を観察し、他のトランザクションに到達する、またはまったく満たされていないことにかかわらず、すべての場合には実行できます。 取引の履歴が作成される操作中にトランザクションシステムによってトランザクションシステムによって処理されます。

    シーケンシャル(通常の)、並列および分散トランザクションがあります。 分散トランザクションは、複数のトランザクションシステムの使用を含み、より複雑なロジックを必要とする(たとえば、2フェーズコミットは二相トランザクション固定プロトコルです)。 また、システムの自律的なトランザクション、またはトランザクション中の一部のシステムでは、親トランザクションの自律部分です。

    例:銀行口座番号5から10の通貨単位の金額の口座番号7に変換する必要があります。 これは、例えば、所与の一連の動作について達成することができる。
    トランザクションを開始します
    バランスアカウント番号5を読んでください
    10の金融機関のバランスを減らす
    新しい口座残高番号5を保存します
    残高番号7を読んでください
    10の通貨ユニットのバランスを増やす
    新しい口座残高番号7を保存します

    終了トランザクション
    これらの動作は、論理的な作業単位「勘定勘定の翻訳」であり、したがってトランザクションです。 このトランザクションを中央に割り込むと、すべての変更をキャンセルしない場合は、アカウントの所有者番号7がそれらを受け取らないのに対して、アカウント所有者番号5を10単位なしで残すことは簡単です。

    OLTPトランザクションの運用処理モード

    OLTPトランザクション動作モード(オンライントランザクション処理)は、組織管理情報システムに常に対象領域の現在の状態を反映し、バッチ処理が非常に限られたニッチを占める。
    OLTP。

    典型的には、OLTPシステムの分析能力は強く制限されており、それらは企業の日々の活動を容易にし、現在現在の瞬間に基づいている。 OLTPクラス情報システムは、特定の主観領域に関連するソースデータ、一次データ処理、ストレージ、適切な可視化、検索、参照および報告資料に関連するソースデータを収集、登録、入力ソースデータを収集するように設計されています。 一次処理には、入力データの正確さと完全性制限のコンプライアンスの検証、これらのデータによって記述されたオブジェクトを識別し、水平リンク、垂直リンクによるデータ伝送。 情報システム内のデータは、特定の法的な力を持つ文書から、またはデータの発生から直接導入されます。 後者の場合、入力されたデータを含む文書がシステムによって印刷され、法的な力が添付されます。

    ターゲットデータベースを介したOLTPシステムでは、データベースの状態を変更し、それらを現在の状態に準拠させるためにそれらをリードするターゲットトランザクションが実行されます(たとえば、請求書のパラメータ、請求書のパラメータ、クレジットまたはその他の事実を強化)。データベースをモデル化する実世界の断片の。 したがって、ターゲットデータベースの主な目的はトランザクションの処理です。

    そのようなシステムは、リアルタイムで入力、構造化された保管および情報処理を行うように設計されています。 OLTPシステムは、クエリタイプを作成することを可能にします。 絶えず同期されたデータベースからデータを提供することによって、オペレーティングシステムは、高い時間間隔でプロセスの変化の動力の動力を追跡せず、実質的にデータ処理を行わない(特定の計算を除く)、そして最も重要なことには形成しないこの機能を決定するために、利用可能なデータに関する結論。

    OLTP。- 私たちは多くの産業の幅広い任務でカバーされています - 会計処理と倉庫会計と文書の会計の自動化など

    このようなシステムの主な機能は、多数のユーザーから多数の短いトランザクションを同時に実行することです。 トランザクション自体は比較的簡単に見えます。たとえば、「アカウントAからの金額を削除するには、この金額をinに追加します」。

    情報システム OLTPクラスは、以下の機能によって特徴付けられます。
    IP特性 - 情報システム - OLTPクラス
    それにかかわらずアルゴリズムの単純さ、
    - 処理された文書の命名法と構造に関するダイナミクス、これはこれらのシステムの即時の近くに対象地域への即時の近くに関連しています。
    ソースデータ収集サイトの - マビティと領土配布
    入力データの正確性と関連性のためのウレクティック要件、
    - マイビティ、十分に頻繁に頻繁に頻繁に頻繁に、人員(ユーザ)の比較的低いコンピュータ資格。
    - 多数のユーザーのサポート。
    - 要求への応答時間。
    - 関連する短い要求
    - 少数のテーブルのクエリにおけるピネーション

    歴史的に そのようなシステムは主に、彼らが会計、サービス速度、データ収集などの必要性を実装しているため、すぐにデータ収集がそれ自体の終わりではなく、累積データが役立つことができることを理解するようになりました。情報はデータから学んだ。
    システム開発戦略
    長い間、次のようなシステムを開発するための戦略として使用されます。
    機能的に関連した文書のグループを処理し、既製の腕の複製を目的とした個々のAWPの構築
    場所の複製と設定を備えたフル機能のパラメータ化システムの構築 しかしながら、この方法によって得られたシステムは、実質的な領域の動力学を克服するための低い適応能力を有していた。 彼らは運用員のための高い要求を提示し、サポートに大きなオーバーヘッドを要求しました。
    最近では、情報システムクラスOLTPを開発するための新しい、第3の戦略が適用される。 その本質は次のとおりです。対象地域の。

    トランザクションは完全に実行されていないアクションです。 トランザクションの実行中にシステムに違反がある場合、データベースはその元の状態に戻り、これはトランザクション(ロールバック)の前にありました。 実行されたすべてのトランザクションがトランザクションログに登録されます。 対応するトランザクションレコードがログに表示されたときに、トランザクションは完了と見なされます。

    OLTP-Technology

    企業情報サービスの代表者とのコミュニケーションの実際には、情報 - OLTPシステム(オンライントランザクション処理)および情報分析技術の収集を目的とした技術の違い、予定、および技術の役割に深刻な誤解を扱う必要があります。 一方、それらは機能性が大幅に異なり、それぞれが情報システム内のその地域に対して責任があります。
    OLTPシステムタスク - これは、データベース内の情報の迅速なコレクションと最適な配置、およびその完全性、関連性、および一貫性を確保しています。 しかしながら、そのようなシステムは、最も効率的で速くそして多次元分析を意図するものではない。
    もちろん、収集されたデータによると、レポートを構築することが可能ですが、それはITスペシャリスト、またはプログラミングおよびコンピューティング技術の分野における特別な訓練とのビジネス分析または恒久的な相互作用を必要とする。
    OLTP技術に基づいて構築された情報システムを使用しているロシア会社の伝統的な意思決定プロセスはどのようなものですか?
    マネージャは、問題の理解に従って情報部門の専門家を割り当てます。 情報部門の専門家は、自分自身の方法で、タスクを実現し、運用システムへの要求を構築し、電子レポートを受信して\u200b\u200b頭の注意をもたらします。 重要な決定を下すためのこのような計画は以下のものをもたらします デメリット:
    - わずかな量のデータを使用しました。
    - 電子レポートの要求と解釈のコンパイル以来、プロセスは長い時間がかかります - 操作はかなり視覚的ですが、マネージャはすぐに決定を下す必要があるかもしれません。
    - 別の文脈でデータを明確にする必要がある場合、および追加の問題とともに、データやデータの検討が必要な場合は、サイクル繰り返しを作成します。 さらに、この遅いサイクルを繰り返す必要があり、原則として、同時に時間分析がさらに費やされている。
    情報技術の専門家の職業訓練と活動の分野の違いは、情報技術の専門家の活動の職業訓練と地域に影響を与えます。 多くの場合、彼らはさまざまなカテゴリーを考えると、その結果、お互いを理解していません。
    有害作用は、知覚のための電子報告の複雑さと同じような要素を有する。 マネージャーには、特に多すぎる可能性があるため、レポートから興味の数を選択する時間がありません。 データの準備に関する作業が最も頻繁に情報部門の専門家に落ちることは明らかです。 その結果、コンピテントスペシャリストは、自然にその資格の増加に貢献していないテーブル、図など、テーブル、図などの準備に関する独自の作業によって気を取られます。
    この状況からの出力は1つであり、それは表現として請求書ゲートによって処方されます:「指の先端の情報」 初期情報は直接消費者分析に利用可能であるべきです。 直接利用可能です(!)。 そして、情報部のスタッフの課題は、情報を収集、蓄積、保存、保存、保護、保存し、アナリストへのアクセス可能性を保証するためのシステムを作成することです。

    適用範囲は、支払い、会計、場所、銀行、株式業務の範囲です。

    OLTPシステム運用治療を実施するための非常に効率的な手段であることは、分析処理の課題にはほとんど適していることがわかった。 これは次のようになります。
    1.伝統的なOLTPシステムの資金は、分析報告書、さらには複雑さの予測でさえも構築することができますが、事前に規制されています。 側面への任意のステップでは、原則として、魅力的なエンドユーザー要件は、データ構造とプログラマーの十分に高い認定に関する知識が必要です。
    2.運用システムに必要な多くの機能能力は分析タスクに対して冗長であり、同時にオブジェクト領域を反映していない可能性があります。 ほとんどの分析タスクを解決するために、分析、予測、モデリングのための外部特殊器具貯蔵庫の使用が必要です。 基本の厳しい構造は、複雑なサンプルおよびソートの場合に許容できる性能を達成することを可能にしないので、ゲートウェイを整理するための高い時間費用を必要とする。
    3.トランザクションとは異なり、分析システムは必要ありません。したがって、データの完全性、それらの予約および回復を確実にするための開発された手段に対して提供されていません。 これにより、実装手段を簡素化するだけでなく、内部オーバーヘッドを削減し、したがってデータを選択するときに生産性を高めることができます。

    各システムによって効果的に解決されたタスクの範囲は、OLTPとOLAPシステムの比較特性に基づいて定義します。

    OLTPシステムのデータは主にそのようなトランザクションをサポートするように編成されています。

    現金端末またはWebノードから導入された注文の登録。

    倉庫内の数字が特定の数より少ない場合に、コンポーネントの注文の配置。

    生産における最終製品の組み立て中の部品を追跡する。

    従業員に関する情報の登録

    レストランの所有者や運転手などのライセンスホルダーの身分証明データの登録。

    比較的少量のデータを参照して、別々のトランザクションが迅速に完了します。 OLTPシステムは、数百および数千のトランザクションの同時処理のために作成および最適化されています。

    OLTPシステムは、毎日の操作をサポートするために必要なデータを優れて記録します。 ただし、情報が管理者の作業を計画するために管理者を意図している場合は、それらのデータは異なる編成されています。 マネージャーはしばしば最終的な情報を必要とします - それらに委託された組織に影響を与える動向を分析するために。

    現代データウェアハウスタスク
    特定の目標とのデータ分離

    データウェアハウステクノロジの開発は、分析目的で使用される操作とデータに使用されるデータを分割する必要性を踏まえました。 リポジトリは、レポート作成に適した機能を提供します。 さらに、トランザクションを実行するユーザーの分割、および選択されていない要求が運用システムの効率に悪影響を与える可能性があるユーザーの報告は、データインフラストラクチャリソースを最適に使用してください。
    データの一時的な値

    また、ストレージは組織に優れたレポート作成および分析プラットフォームを提供していますが、リアルタイムで、原則として、利用可能なデータの年齢によって判断しないでください。 技術的な制限により、リポジトリは通常バッチデータを使用して夜間に補給されます。 これを行うには、変更を検索してベース全体の垂直方向の読み取りを実行するバッチプログラムを使用してください。 そのようなETLアプローチを使用してリポジトリに入るデータは常に廃止されます(1日あたり)。

    処理中のデータの量、ならびにデータ処理システムの数および様々なデータ処理システムが増加するにつれて、記憶充填プロセスの時間および複雑さが増大する。 同時に、システムの稼働期間の増加、制限されたサービス契約は、バッチ操作を減らす必要があることにつながります。 より多くのデータと競争圧力の組み合わせは、IT組織にとって深刻な問題を引き起こします。

    昨日のデータに基づいて行われた決定は、ほとんどの組織を満たすことを中止します。 リアルタイムの決定には、リポジトリのデータを統合するための特別な要件を課すリアルタイムデータが必要です。

    さらに、リポジトリで実行された分析操作は、データが出現するOLTPシステムに再度送信されなければなりません。 したがって、分析処理は集中化され、集約されたデータに採用された解決策のリポジトリへの送信は、対応するOLTPシステムを保証する。

    これらの傾向は次のように実施されています。
    データウェアハウスのリアルタイムデータの統合 オペレーティングシステムからリポジトリへのリアルタイムデータの取得と転送これにより、分析にデータがあります。
    アクティブなデータウェアハウス。 リアルタイムでCD、ビジネスインテリジェンスがビジネスソリューションの処理と実行に補完されました。 ソリューションは自動的にOLTPシステムに送信されます。 その結果、閉じた処理サイクルが形成される。

    リアルタイムでリポジトリの機能を達成したいという要望において、成功はしばしば統合ツールの有能な選択とデータ取得に依存し、それは情報の品質と適時性を改善する可能性を保証します。
    リアルタイムでのリポジトリのデータの統合

    リアルタイム統合をサポートするためには、オペレーションデータの抽出へのバッチアプローチを、ソースシステムのステータスを常に監視し、データへの変更をキャプチャして変換してから、それらをリポジトリにアップロードする必要があります。できるだけリアルタイムに近いモード。 恒久的なデータコレクションでは、いつでも任意のフレーム内の利益と価格要素を分析できます。 傾向は、選択された周期性と遅延なしで分析することができます。

    ETLは、リポジトリ内の大量のデータを同様のロードするタスクに対する理想的な解決策であり、そしてまた広範囲のデータ変換オプションを提供します。 しかしながら、通常、ソースシステムを更新してソースがデータの受信時に変化しないように、通常、ETL動作が実行される。 これにより、OLTPシステムとストレージ間の不一致につながります。 その結果、データとアプリケーションは必ずしもビジネスユーザーが利用できません。

    EAIソリューションは、以前にアプリケーションを統合することを目的としたEAIソリューションは、ETLテクノロジと競合または共存し、統合手段を表し、リアルタイムデータを受信します。 EAIソリューションは、ソースシステムとターゲットシステムとの間で情報を送信し、データ配信を保証し、高度なストリームサポートを提供し、基本的な変換要素を簡素化します。

    しかし、EAIテクノロジは、この方法の最初の送信はアプリケーションの統合(データではなく)の統合、およびそのアプリケーションの起動とメッセージとメッセージの送信における本質であるため、ボリュームに制限を課します。 それにもかかわらず、リアルタイムの情報を移動し、統合プロセスでその完全性を維持する能力は、オペレーティングシステムとアクティブストレージ間の交換にEAIテクノロジを適しています。

    リアルタイムデータ統合へのもう1つのアプローチは、実行されたトランザクションで機能しているリアルタイムでの不均一媒体内のトランザクションデータの取得、トランザクションデータの取得、トランザクションデータの検証、および検証を取得、トランザクションデータ管理技術(TDM)の検証です。それらはOLTPシステムから、基本的な変換方法を適用し、それらをストレージに送信します。 そのアーキテクチャによると、Asynchronneテクノロジは、同期動作を提供し、トランザクション内のデータの完全性を維持しながら、1分のほんの遅延で動作します。

    EAIとTDMは、整数データサンプルではなく、変更とデータの更新を送信するように設計されています。 これらの技術はデータ操作言語(DML)の整合性をサポートしているため、ソースシステムの中断を必要としません。 これにより、必要なデータ移動の量が大幅に削減されます。 そして、ETLが主にソースのダウンロードとデータ変換のために設計されている場合、EAIとTDMは恒久的なデータ収集に適しています。

    企業の数が増えていると、リポジトリのデータを収集するためにTDMテクノロジを使用しています。 TDMSは、スプリット秒の遅延を持つ異種データベース環境のデータを使用してキャプチャ、送信、配信、および確認操作を取ります。

    トランザクションレベルでの修正データの送信を使用すると、システムをリポジトリの塗りつぶしと同時にアクティブモードとプロセス動作で動作させることができます。 この場合、バッチ処理間隔の依存性は完全に排除され、各トランザクションの整合性が保持されます。

    リポジトリとOLTPシステムとの統合は、1つまたは複数の運用システムにおけるデータデータに基づいて、受信したソリューション上のデータの転送と同時にトランザクションデータを受信および送信することを含む。 そのような閉鎖された作業サイクルもTDMによって提供される。
    主な特徴と統合の機会

    TDM統合ツールには、いくつかの重要な機能機能があります。

    データ収集

    データ収集モジュールはソースデータベースにインストールされ、新しく着信されたすべてのトランザクションを常に監視します。 これは、トランザクションが依然として実行され、原則としてメモリ内にある時点で、オペレーションログから大量のデータを読み取ることによって実現されます。 データはトランザクションレベルで処理され、実行された操作のみがストレージに送信されます。

    ダッシュデータ

    すべての新しいデータはHDのストレージの中間領域に送信され、時間遅延は1秒のほんの一部です。 したがって、最も関連性のあるデータは、常に最も高度なビジネスインテリジェンス方法、および報告と意思決定のために利用可能です。 より小さなデータサンプルが指定された期間(パケット送信の場合よりも)送信されるので、OLTPシステムの追加負荷は非常に重要ではないことが判明した。

    不均一性

    データウェアハウスは、OLTPシステムとして同じオペレーティングシステムまたはデータベース内で必ずしも機能しません。 さらに、いくつかからデータを収集する必要があるときに状況が多い オペレーティングシステム そして塩基。 その結果、統合ツールは、プラットフォームだけでなく、幅広いDBMS、およびプラットフォームをサポートしている必要があります。これにより、最も異種のITインフラストラクチャでさえ要件が簡単になります。 そのため、組織は企業の標準や好みに基づいてプラットフォームを選択することができます。また、既製のHDソリューションに最小限の影響を及ぼします。

    統合ツールによって収集されたデータは、プラットフォームとDBMSに依存形の形式に変換されます。 したがって、不均一性は維持され、ソースシステムまたはターゲットシステムの動作を中断すると、損失またはデータの損傷の危険性が排除される。

    データの選択性

    統合ツールは、リポジトリに必要なデータのみを送信します。 通常のOLTPシステムでは、データベースを処理するアプリケーションにのみ関連付けるフィールドがあります。 リポジトリにこれらすべてのパラメータが必要ではありません。 統合ツールは、データベースから削除される列の識別を保証し、リポジトリへの転送を保証する必要があります。

    また、ユーザ基準に応じて、ソースシステムの基部からの特定の行を選択することができる。 たとえば、地理的にデータを分離するか、ターゲットリポジトリにのみ関連する製品を選択する。

    データ変換

    しかしながら、データ送信における選択性は重要であるが、ターゲットシステムによっては、変換、正規化またはデータの非正規化のタスクが残る。 さまざまなデータモデルとOLTPベースとストレージ間のオブジェクトの構造のために、列とソースシステムはターゲットシステム内の列と一致するように変換できます。 場合によっては、さまざまなソース行から複数\u200b\u200bの列を単一の文字列にマージする必要があります。 複雑なデータ変換の場合、この組織に固有のCDの充填規則を実装するために、ユーザープログラムへのポイントを出力するように提案されています。

    柔軟性

    データをキャプチャして配信するプロセスを含む、データベースまたはターゲットシステムの新しい情報源を迅速かつ簡単に含めることができ、重要な役割を果たす。

    テーブルの動的定義

    リポジトリの作業を中断しないようにするために、データベース内の変化の可能性を迅速に適応させる可能性があります。 元のテーブルとターゲット表の定義は、新しいバージョンのソフトウェアの外観、またはストレージタンクの要件の変更を伴って変更されます。 テーブル回路の動的タスクはパラメトリックファイルを使用して可能です。 このようにして、ソフトウェアや廃止システムをアップグレードせずに、元のテーブルまたはターゲットテーブルを変更することができます。

    フィードバック

    アクティブストレージは、特定の条件または規則が実行されている場合にデータを送信します。 困難な操作は、OLTP内のレコードを更新することを含み得る。 たとえば、不正検出システムでは疑わしい操作を強調表示し、リポジトリ内のユーザーアカウントのステータスを変更できます。 このような状態の変化は、統合ツールによって監視され、適切な運用トランザクション処理のシステムに送信することができます。 OLTPシステム内の情報の返品送信は、クローズドサイクルの適用、ならびにレポート環境、データウェアハウスに関する情報を同時に送信するために非常に重要です。 バックアップ または他のターゲットシステム。
    技術を組み合わせる

    統合DWとOLTPのタスクは、TDMプロセスとETLプロセスを組み合わせることが可能です。 リアルタイムでデータを処理することを含み、一定のキャプチャを取得し、トランザクションレベルでデータを抽出します。 TDMツールは、ターゲットデータベースの中間記憶レベルにリアルタイムデータを送信できます。ここで、ETLサーバーはデータを傍受し、それらへの変換を使用してストレージにダウンロードします。 このアプローチには、欠点がある(特に追加の遅延とETLサーバーをサポートする必要性)がありますが、データ変換要件が複雑すぎる場合は正規化されます。

    利点は、新しいトランザクションデータがOLTPシステムに対して非常に小さいパフォーマンス効果ですぐにキャプチャされることです(通常のETLプロセスと比較して)。
    等.................

    トピックを続ける:
    インターネット

    Windowsブートディスクを作成する最も一般的な方法の1つは、この記事で説明されている方法です。 そしてより正確に創造の中で、それは遠い世界で私たちを助けるでしょう...