なぜ情報はエンコードと呼ばれるのでしょうか? コンピューター内の情報をコーディングすること。 オーディオコーディング規格

3. グラフィック情報のコーディング4

4. 音声情報のエンコーディング8

5. 結論10

参考文献11

導入

最新のコンピューターは、数値、テキスト、グラフィック、サウンド、およびビデオ情報を処理できます。 コンピューター内のこれらの種類の情報はすべてバイナリ コードで表現されます。つまり、アルファベットの 2 乗が使用されます (0 と 1 の 2 つの文字のみ)。 これは、情報を一連の電気インパルスの形式で表現するのが便利であるという事実によるものです。インパルスは存在しません (0)、インパルスは存在します (1)。 このようなコーディングは通常バイナリと呼ばれ、0 と 1 の論理シーケンス自体は機械語と呼ばれます。 マシン バイナリ コードの各桁は、1 ビットに等しい量の情報を運びます。 この結論は、マシンのアルファベットの数字を同じ確率のイベントとして考慮することで得られます。 2 進数を書き込む場合、2 つの可能な状態のうち 1 つだけを選択できます。これは、1 ビットに等しい量の情報を運ぶことを意味します。 したがって、2 桁には 2 ビットの情報が含まれ、4 桁には 4 ビットの情報が含まれます。ビット単位の情報量を決定するには、バイナリ マシン コードの桁数を決定するだけで十分です。

テキスト情報のエンコード

現在、ほとんどのユーザーはコンピュータを使用して、文字、数字、句読点などの記号で構成されるテキスト情報を処理しています。

従来、1 文字をエンコードするには、1 バイトに等しい情報量が使用されます。つまり、I = 1 バイト = 8 ビットです。 起こり得るイベントの数 K と情報量 I を結び付ける式を使用すると、(シンボルが起こり得るイベントであると仮定して) エンコードできるさまざまなシンボルの数を計算できます: K = 2I = 28 = 256、つまりテキスト情報を表す、256 文字までのアルファベットを使用できます。

エンコードの本質は、各文字に 00000000 ~ 11111111 のバイナリ コード、または 0 ~ 255 の対応する 10 進コードが割り当てられることです。

現在、ロシア文字のエンコードには 5 つの異なるコード テーブル (KOI - 8、CP1251、CP866、Mac、ISO) が使用されており、1 つのテーブルを使用してエンコードされたテキストは、別のエンコードでは正しく表示されません。 これは、結合された文字エンコーディング テーブルのフラグメントとして視覚的に表現できます。 同じバイナリ コードに異なるシンボルが割り当てられます。

バイナリコード

10進コード

ただし、ほとんどの場合、テキスト ドキュメントのトランスコーディングはユーザーが行い、特別なプログラムがアプリケーションに組み込まれたコンバーターとなります。 1997 年以降、Microsoft Windows および Office の最新バージョンは、各文字に 2 バイトを割り当てる新しい Unicode エンコードをサポートしているため、256 文字ではなく 65536 個の異なる文字をエンコードできます。

文字の数値コードを決定するには、コード テーブルを使用するか、テキスト エディター Word 6.0 / 95 で作業します。これを行うには、メニューから [挿入] - [記号] を選択し、その後 [記号] ダイアログ ボックスを開きます。パネルが画面に表示されます。 選択したフォントの文字テーブルがダイアログ ボックスに表示されます。 この表の文字は、スペース記号 (左上隅) で始まり、文字「I」 (右下隅) で終わるように、左から右に順番に 1 行ずつ配置されています。

Windows エンコード (CP1251) で文字の数値コードを決定するには、マウスまたはカーソル キーを使用して目的の文字を選択し、[キー] ボタンをクリックする必要があります。 この後、画面に [設定] ダイアログ ボックスが表示され、左下隅に選択した文字の 10 進数値コードが表示されます。

グラフィック情報のエンコード

グラフィック情報は、アナログまたはディスクリートの 2 つの形式で表示できます。 色が連続的に変化する絵画はアナログ表現の例ですが、インクジェット プリンタを使用して印刷され、異なる色の個々のドットで構成される画像は離散表現です。 グラフィック画像を分割(サンプリング)することにより、グラフィック情報がアナログ形式から離散形式に変換されます。 この場合、コーディングが実行され、コードの形式で各要素に特定の値が割り当てられます。 画像をエンコードするとき、画像は空間的に離散化されます。 これは、多数の小さな色の断片から画像を構築することに似ています (モザイク法)。 画像全体が別々の点に分割され、各要素にカラーコードが割り当てられます。

この場合、エンコードの品質は次のパラメータに依存します: ドット サイズと使用される色の数。 ドット サイズが小さいほど、つまり画像がより多くのドットで構成されているほど、エンコード品質は高くなります。 より多くの色が使用されるほど (つまり、画像点がより多くの状態を取ることができ)、各点が保持する情報が増えるため、エンコード品質が向上します。 グラフィック オブジェクトの作成と保存は、ベクトル、フラクタル、またはラスター イメージの形式で、いくつかの種類で可能です。 別の主題は 3D (三次元) グラフィックスであり、画像形成のベクトル法とラスター法を組み合わせたものです。 彼女は、仮想空間内のオブジェクトの 3 次元モデルを構築するための方法と技術を研究しています。 各タイプは、グラフィック情報をエンコードする独自の方法を使用します。

ラスター画像。 虫眼鏡を使用すると、新聞などの白黒グラフィック画像が、特定のパターン (ラスター) を構成する小さな点で構成されていることがわかります。 19世紀のフランスでは、点描画という絵画の新しい方向性が生まれました。 彼の手法は、ブラシを使ってキャンバス上に多色の点の形で絵を描くことでした。 この方法は、グラフィック情報をエンコードするために印刷でも長い間使用されてきました。 描画の精度はドットの数とサイズによって決まります。 図面をドットに分割した後、左隅から開始して線に沿って左から右に移動し、各ドットの色をコーディングできます。 以下では、そのような点の 1 つをピクセルと呼びます (この言葉の起源は、英語の略語「picture element」に関連しています)。 ラスター画像の体積は、ピクセル数(色数に応じた1点の情報量)の積で決まります。画質はモニターの解像度で決まります。解像度が高いほど画質が良くなります。つまり、ラスター ラインと 1 ラインあたりのドットの数が多いほど、画質は高くなります。現代の PC では、通常、640 x 480、800 x 600、1024 x 768、および 1280 x 1024 の画面解像度が使用されます。各点とその線形座標は整数を使用して表現できるため、このエンコード方法によりバイナリ コードを使用してグラフィック データを処理できると言えます。

白黒のイラストについて言えば、ハーフトーンを使用しない場合、ピクセルは、光る (白) と光らない (黒) の 2 つの状態のいずれかになります。 また、ピクセルの色に関する情報はピクセル コードと呼ばれるため、それをエンコードするには 1 ビットのメモリで十分です (0 - 黒、1 - 白)。 イラストが 256 のグレーの階調を持つドットの組み合わせの形式で考慮されている場合 (これらが現在一般に受け入れられているものです)、任意のドットの明るさをエンコードするには 8 ビットの 2 進数で十分です。 コンピュータグラフィックスにおいて色は非常に重要です。 これは、視覚的な印象を高め、画像の情報量を増やす手段として機能します。 人間の脳の色彩感覚はどのように形成されるのでしょうか? これは、物体を反射または放射して網膜に入る光束を分析した結果として発生します。

カラーモデル。 カラー グラフィック イメージのコーディングについて話す場合は、任意の色をその主要コンポーネントに分解する原理を考慮する必要があります。 HSB、RGB、CMYK といったいくつかのコーディング システムが使用されます。 最初のカラー モデルはシンプルで直感的です。つまり人間にとって便利です。2 番目はコンピュータにとって最も便利で、最後の CMYK モデルは印刷会社にとって便利です。 これらのカラー モデルが使用されるのは、赤、緑、青、またはその派生物といった「純粋な」スペクトル色の組み合わせである放射によって光束が形成される可能性があるという事実によるものです。 加法混色再現 (発光オブジェクトに一般的) と減法混色再現 (反射オブジェクトに一般的) があります。 第1のタイプのオブジェクトの例は、モニタの陰極線管であり、第2のタイプのオブジェクトの例は、印刷物である。

1) HSB モデルは、色相 (Hue)、色の彩度 (Saturation)、色の明るさ (Brightness) の 3 つのコンポーネントによって特徴付けられます。

2) RGB 法の原理は次のとおりです。任意の色は、赤 (Red, R)、緑 (Green, G)、青 (Blue, B) の 3 色の組み合わせで表現できることが知られています。 これらの成分の有無により、他の色とその色合いが得られます。

3) CMYK方式の原理。 このカラー モデルは、出版物の印刷を準備するときに使用されます。 各原色は追加の色に関連付けられています (主要な色を白に補う)。 追加の色は、他の原色のペアを合計することによって得られます。

カラー グラフィックスを表示するには、次のようないくつかのモードがあります。 ハイカラー; 索引。

フルカラー モードでは、各コンポーネントの明るさをエンコードするために 256 の値 (8 バイナリ ビット) が使用されます。つまり、(RGB システムで) 1 つのピクセルの色のエンコードに 8 * 3 = 24 ビットを費やす必要があります。 。 これにより、1,650 万色を一意に識別できるようになります。 これは人間の目の感度にかなり近いです。 CMYK システムを使用してエンコードする場合、カラー グラフィックを表現するには、8*4=32 バイナリ ビットが必要です。 ハイ カラー モードは、16 ビット 2 進数を使用してエンコードします。つまり、各ポイントをエンコードするときに 2 進数の数が減ります。 ただし、これにより、エンコードされた色の範囲が大幅に減少します。 インデックスカラーコーディングでは、256 の色調のみを送信できます。 各色は 8 ビットのデータを使用してエンコードされます。 しかし、256の値は人間の目にアクセスできる色の全範囲を伝えるわけではないため、グラフィックデータにはパレット(ルックアップテーブル)が添付されており、それなしでは再現が不十分になることが理解されています。海は判明する可能性があります葉は赤く、葉は青く見えるかもしれません。 この場合、ラスター ポイント コード自体は色そのものを意味するのではなく、パレット内のその番号 (インデックス) のみを意味します。 したがって、モードの名前はインデックスです。

表示される色の数 (K) とそれらをエンコードするためのビット数 (a) の対応関係は、次の式で求められます: K = 2 a。

十分です…

漫画で見られるタイプの絵だが、野生動物の描写には不十分

雑誌や写真に掲載されている画像

224 = 16 777 216

自然界で観察される画像と遜色のない画像を処理・伝送

画面に表示される画像のバイナリ コードはビデオ メモリに保存されます。 ビデオ メモリは、電子揮発性記憶装置です。 ビデオ メモリのサイズは、ディスプレイの解像度と色数によって異なります。 ただし、その最小容量は、画像の 1 フレーム (1 ページ) に収まるように決定されます。 解像度とピクセル コード サイズの積の結果として。

Vmin = M * N * a.

8 色パレットのバイナリ コード。

カラーコンポーネント

赤 1 0 0

緑 0 1 0

青 0 0 1

青 0 1 1

紫 1 0 1

黄 1 1 0

白 1 1 1

黒 0 0 0

16 色の​​パレットを使用すると、使用する色の数を増やすことができます。 ここでは、原色の 3 ビット + 強度の 1 ビットの 4 ビット ピクセル エンコードを使用します。 後者は、3 つの基本色の明るさ (3 つの電子ビームの強度) を同時に制御します。 原色の強度を個別に制御することにより、生成される色の数が増加します。 したがって、24 ビットの色深度のパレットを取得するには、各色に 8 ビットが割り当てられます。つまり、256 の強度レベルが可能です (K = 28)。

ベクトル イメージは、基本セグメントと円弧で構成されるグラフィック オブジェクトです。 画像の基本要素は線です。 他のオブジェクトと同様に、形状 (直線、曲線)、厚さ、色、スタイル (点線、実線) のプロパティがあります。 閉じた線には、(他のオブジェクトまたは選択した色のいずれかで) 塗りつぶされる特性があります。 他のすべてのベクター グラフィックス オブジェクトは線で構成されます。 線は数学的に単一のオブジェクトとして記述されるため、ベクトル グラフィックスを使用してオブジェクトを表示するためのデータ量は、ラスター グラフィックスよりもはるかに少なくなります。 ベクトル画像に関する情報は通常の英数字としてエンコードされ、特別なプログラムによって処理されます。

ベクター グラフィックを作成および処理するためのソフトウェア ツールには、次の GR が含まれます。CorelDraw、Adobe Illustrator、およびラスター イメージをベクター イメージに変換するための特殊なパッケージであるベクタライザー (トレーサー) です。

フラクタル グラフィックスは、ベクター グラフィックスと同様に数学的計算に基づいています。 ただし、ベクトルとは異なり、その基本要素は数式そのものです。 これにより、コンピュータのメモリにはオブジェクトが保存されず、画像は方程式のみを使用して構築されるという事実が生じます。 この方法を使用すると、最も単純な規則的な構造だけでなく、風景を模倣した複雑なイラストも構築できます。

音声情報のエンコード

現在、コンピュータはさまざまな分野で広く利用されています。 音情報や音楽の処理も例外ではありませんでした。 1983 年まで、録音された音楽はすべてビニール レコードとコンパクト カセットでリリースされました。 現在、CD は広く普及しています。 スタジオ サウンド カードがインストールされ、MIDI キーボードとマイクが接続されたコンピュータがある場合は、専用の音楽ソフトウェアを使用して作業できます。 通常、それはいくつかのタイプに分類できます。 1) 特定のサウンド カードおよび外部デバイスで動作するように設計されたあらゆる種類のユーティリティおよびドライバー。 2) オーディオ エディタは、サウンド ファイルを操作するように設計されており、サウンド ファイルを部分に分割したり、エフェクトを使用して処理したりするなど、あらゆる操作を実行できます。 3) ソフトウェア シンセサイザー。比較的最近に登場し、強力なコンピュータでのみ正しく動作します。 さまざまなサウンドを作成して実験することができます。 その他。

最初のグループには、すべてのオペレーティング システム ユーティリティが含まれます。 たとえば、Win 95 および 98 には、サウンドの再生/録音、CD および標準 MIDI ファイルの再生のための独自のミキサー プログラムとユーティリティがあります。 サウンド カードをインストールした後、これらのプログラムを使用してその機能を確認できます。 たとえば、Phonograph プログラムは、wave ファイル (Windows 形式の録音ファイル) を操作するように設計されています。 これらのファイルの拡張子は .WAV です。 このプログラムは、テープ レコーダーで使用されるものと同様の技術を使用して、サウンド録音を再生、録音、編集する機能を提供します。 蓄音機を使用するには、マイクをコンピュータに接続することをお勧めします。 サウンドを録音する必要がある場合は、サウンドの録音時間が左右されるため、音質を決定する必要があります。 録音品質が高くなるほど、可能なサウンド持続時間は短くなります。 平均的な録音品質では、音声を十分に録音でき、最大 60 秒の長さのファイルを作成できます。 録音時間は約6秒と音楽CD並みの音質です。

音声を媒体に記録するには、音声を電気信号に変換する必要があります。 これはマイクを使用して行われます。 最も単純なマイクには、音波の影響で振動する膜が付いています。 コイルが膜に取り付けられており、磁場中で膜と同期して動きます。 コイルには交流電流が発生します。 電圧変化は音波を正確に反映します。 マイクの出力に現れる交流はアナログ信号と呼ばれます。 電気信号に適用される場合、「アナログ」とは、信号が時間と振幅において連続していることを意味します。 空気中を伝わる音波の形状を正確に反映します。

オーディオ情報は、離散形式またはアナログ形式で表現できます。 それらの違いは、情報の離散表現では、物理量が突然変化し (「はしご」)、有限の値セットを取ることです。 情報がアナログ形式で表現される場合、物理量は継続的に変化する無限の値を取ることができます。

サウンドをアナログからデジタル、またはその逆に変換するプロセスを簡単に見てみましょう。 サウンド カードで何が起こっているのかを大まかに把握しておくと、オーディオを扱う際の間違いを避けることができます。 音波は、マイクを使用してアナログ交流電気信号に変換されます。 信号はオーディオ パスを通過し、信号をデジタル形式に変換するデバイスであるアナログ デジタル コンバーター (ADC) に入ります。 簡略化すると、ADC の動作原理は次のとおりです。一定の間隔で信号の振幅を測定し、振幅の変化に関する情報を含む一連の数値をデジタル パス経由で送信します。 デジタル オーディオは、デジタル - アナログ コンバーター (DAC) を使用して出力されます。DAC は、入力デジタル データに基づいて、適切なタイミングで必要な振幅の電気信号を生成します。

同じサウンドを 1 kHz (ピアノの第 7 オクターブまでの音がこの周波数にほぼ対応します) でグラフ化したが、異なる周波数でサンプリングした場合 (正弦波の底部はすべてのグラフに示されているわけではありません)、その違いは次のようになります。が見えるようになります。 時間を示す横軸の1目盛りが10サンプルに相当します。 スケールは同じです (付録図 1.13 を参照)。 11 kHz では、50 サンプルごとに約 5 つの音波振動があることがわかります。これは、1 つの正弦波周期がわずか 10 個の値で表されることを意味します。 これはかなり不正確なレンダリングです。 同時に、44 kHz のデジタル化周波数を考慮すると、正弦波の各周期にはすでにほぼ 50 のサンプルが存在します。 これにより、高品質の信号を取得できます。

ビット深度は、アナログ信号の振幅の変化が発生する精度を示します。 デジタル化中に各瞬間の信号振幅値が送信される精度によって、デジタル - アナログ変換後の信号の品質が決まります。 波形再構成の信頼性はビット深度に依存します。

振幅値を符号化するには、バイナリ符号化の原理が使用されます。 音声信号は、一連の電気パルス (バイナリの 0 と 1) として表現される必要があります。 通常、振幅値の 8、16 ビット、または 20 ビット表現が使用されます。 連続オーディオ信号をバイナリ コーディングすると、一連の離散信号レベルに置き換えられます。 エンコードの品質は、サンプリング周波数 (単位時間あたりの信号レベルの測定数) に依存します。 サンプリング周波数が増加すると、情報のバイナリ表現の精度が向上します。 周波数 8 kHz (1 秒あたりのサンプル数 8,000) では、サンプリングされたオーディオ信号の品質はラジオ放送の品質に相当し、周波数 48 kHz (1 秒あたりのサンプル数 48,000) では音質に相当します。オーディオ CD の。

8 ビット エンコードを使用すると、デジタル デバイスのダイナミック レンジ (28 = 256) の最大 1/256 のアナログ信号振幅精度を達成できます。

オーディオ信号の振幅値を表すために 16 ビットエンコーディングを使用すると、測定精度は 256 倍に向上します。

最新のコンバータは通常、20 ビット信号エンコードを使用しており、これにより高品質のオーディオ デジタル化が可能になります。

結論

コードは、事前定義された概念を記録 (または伝達) するための一連の規則 (または信号) です。

情報コーディングは、情報の特定の表現を形成するプロセスです。 より狭い意味では、「コーディング」という用語は、情報表現の 1 つの形式から、保存、送信、または処理により便利な別の形式への移行として理解されることがよくあります。

通常、各画像はエンコード時に個別の文字で表されます。 記号は、互いに異なる要素の有限集合の要素です。 記号とその意味を合わせてシンボルと呼びます。 コード長とは、エンコードに使用される文字数です。

コードの長さは定数または非定数にすることができます。 コンピュータ メモリ内の情報を表現するには、バイナリ コード化方法が使用されます。

基本的なコンピュータのメモリ セルの長さは 8 ビットです。 各バイトには独自の番号があります。 コンピューターが単一の単位として処理できる最大のビット列は、マシンワードと呼ばれます。 マシンワードの長さはプロセッサのビット深度によって異なり、16 ビット、32 ビットなどになります。 整数を表すもう 1 つの方法は、2 の補数コードを使用することです。 値の範囲は、ストレージに割り当てられたメモリ ビット数によって異なります。 正の数の補数コードは、その直接コードと同じです。

参考文献

1.コンピュータ科学と情報技術。 エド。 Yu.D. ロマノバ、第 3 版、M.: EKSMO、2008 年

2. Kostrov B.V. 情報のデジタル伝送とコーディングの基礎。 - TechBook、2007、192 ページ。

3. Makarova N.V.「情報学」:教科書。 - M.: 財務と統計、2005 - 768 p.

4. ステパネンコ O. S. パーソナルコンピュータ。 自己取扱説明書弁証法。 2005 年、28 ページ。

コンピュータでのテキスト情報のエンコードは、デバイスの正しい動作や特定のフラグメントの表示にとって不可欠な条件となる場合があります。 テキストと視覚情報、サウンドを使用してコンピューターの操作中にこのプロセスがどのように発生するか - この記事ではこれらすべてを分析します。

導入

電子コンピューター (日常生活ではコンピューターと呼ばれます) は、非常に特殊な方法でテキストを認識します。 彼女にとって、各テキスト断片を互いに分離されたシンボルのグループとして認識するため、テキスト情報をエンコードすることは非常に重要です。

記号とは何ですか?

ロシア語、英語、その他の文字だけでなく、句読点やその他の文字もコンピュータの記号として機能します。 コンピューターに入力するときに単語を区切るために使用するスペースさえも、デバイスでは記号として認識されます。 ある意味、これは高等数学を非常に彷彿とさせます。なぜなら、多くの教授によれば、ゼロには二重の意味がある、つまり、数字であると同時に何も意味を持たないからです。 哲学者にとっても、余白の問題は差し迫った問題となることがあります。 もちろん冗談ですが、よく言われるように、どんな冗談にも真実は含まれています。

どのような情報があるのでしょうか?

したがって、情報を認識するには、コンピュータが処理プロセスを開始する必要があります。 いったいどんな情報があるのでしょうか? この記事のトピックは、テキスト情報のエンコードです。 私たちはこのタスクに特に注意を払いますが、他のミクロなトピックも扱います。

情報には、テキスト、数値、音声、グラフィックが含まれます。 コンピューターは、たとえばキーボードで入力した内容を画面に表示するために、テキスト情報をエンコードするプロセスを実行する必要があります。 記号や文字が表示されますが、これは理解できます。 機械は何を見ているのでしょうか? 彼女は、すべての情報を、テキストについてのみ話しているわけではありませんが、0 と 1 の特定のシーケンスとして認識します。 これらは、いわゆるバイナリ コードの基礎を形成します。 したがって、デバイスが受け取った情報を、デバイスが理解できるものに変換する処理を「テキスト情報のバイナリエンコード」と呼びます。

バイナリコードの動作原理の簡単な説明

情報のバイナリコーディングが電子機器で最も普及しているのはなぜですか? 0 と 1 を使用してエンコードされたテキスト ベースは、任意の記号と記号のシーケンスにすることができます。 ただし、情報のバイナリ テキスト エンコードが持つ利点はこれだけではありません。 重要なのは、このコーディング方法の基礎となる原理は非常にシンプルであると同時に、非常に機能的であるということです。 電気インパルスがある場合、それは (もちろん条件付きで) 単位でマークされます。 衝動はありません - ゼロでマークされます。 つまり、情報のテキストコーディングは、一連の電気インパルスを構築する原理に基づいています。 バイナリコードシンボルから構成される論理的なシーケンスは、機械語と呼ばれます。 同時に、バイナリコードを使用してテキスト情報をエンコードして処理することにより、かなり短時間で操作を実行できます。

ビットとバイト

機械が認識する数値には、ある程度の情報が含まれています。 それは 1 ビットに相当します。 これは、一連の暗号化された情報を構成するすべての 1 とすべての 0 に適用されます。

したがって、いずれの場合も、バイナリコード列の文字数がわかれば、情報量を知ることができる。 それらは数値的には互いに等しくなります。 コードの 2 桁には 2 ビットの情報が含まれます (10 桁 - 10 ビットなど)。 ご覧のとおり、バイナリ コードの特定のフラグメントに含まれる情報量を決定する原理は非常に単純です。

コンピュータ内で文字情報をコーディングする

あなたは今、ロシア語のアルファベットの文字列で構成されている記事を読んでいると考えられます。 そして、前述したように、コンピューターはすべての情報を (この場合も) 文字ではなく、電気インパルスの有無を示す 0 と 1 の並びとして認識します。

重要なのは、バイトと呼ばれる従来の測定単位を使用して、画面に表示される 1 文字をエンコードできるということです。 上で書いたように、バイナリコードにはいわゆる情報負荷があります。 数値的には、選択したコード フラグメント内の 0 と 1 の合計数に等しいことを思い出してください。 したがって、8 ビットで 1 バイトになります。 同じサイズの 8 つのセルで構成される長方形を紙に描くと簡単にわかるように、信号の組み合わせは非常に異なる場合があります。

テキスト情報は 256 文字のアルファベットを使用してエンコードできることがわかりました。 ポイントは何ですか? その意味は、各文字が独自のバイナリ コードを持つという事実にあります。 特定の文字に「結び付けられた」組み合わせは、00000000 から始まり 11111111 で終わります。2 進数から 10 進数体系に移行すると、そのような体系で 0 から 255 までの情報をエンコードできます。

現在、ロシア語のアルファベットの文字のエンコードを使用するさまざまなテーブルがあることを忘れないでください。 たとえば、ISO と KOI-8、Mac と CP の 2 つのバリエーション (1251 と 866) です。これらのテーブルのいずれかでエンコードされたテキストが、このテーブル以外のエンコードでは正しく表示されないことを確認するのは簡単です。 これは、異なるテーブルでは異なるシンボルが同じバイナリ コードに対応するためです。

最初はこれが問題でした。 しかし、今日のプログラムには、テキストを正しい形式に変換する特別なアルゴリズムが組み込まれています。 1997 年は、Unicode と呼ばれるエンコーディングの作成によって特徴づけられました。 この中で、各文字は自由に使える 2 バイトを持っています。 これにより、より多くの文字数を含むテキストをエンコードできるようになります。 256 と 65536: 違いはありますか?

グラフィックコーディング

テキスト情報とグラフィック情報のコーディングにはいくつかの類似点があります。 ご存知のとおり、「モニター」と呼ばれるコンピュータ周辺機器は、グラフィック情報を表示するために使用されます。 現在、グラフィックス (ここではコンピューター グラフィックスについて話しています) はさまざまな分野で広く使用されています。 幸いなことに、パーソナル コンピューターのハードウェア機能により、非常に複雑なグラフィックスの問題を解決できます。

近年、映像情報の処理が可能になりました。 しかし、テキストはグラフィックよりもはるかに「軽く」、原則として理解できます。 このため、グラフィック ファイルの最終的なサイズを大きくする必要があります。 このような問題は、グラフィック情報が表示される本質を知ることで解決できます。

まず、この種の情報がどのグループに分類されるかを理解しましょう。 まずはラスターです。 2つ目はベクトルです。

ラスター イメージは市松模様の紙に非常に似ています。 そのような紙上の各セルは、ある色または別の色で塗りつぶされます。 この原理はモザイクを彷彿とさせます。 つまり、ラスターグラフィックスでは画像が別々の基本部分に分割されていることがわかります。 それらはピクセルと呼ばれます。 ピクセルはロシア語に翻訳すると「点」を意味します。 ピクセルがラインに対して相対的に順序付けされるのは論理的です。 グラフィック グリッドは、特定の数のピクセルのみで構成されます。 ラスターとも呼ばれます。 これら 2 つの定義を考慮すると、ラスター イメージは長方形のグリッド上に表示されるピクセルの集合にほかならないと言えます。

モニターのラスターとピクセル サイズは画質に影響します。 モニターのラスターが大きいほど、高くなります。 ラスター サイズは画面解像度であり、ユーザーなら誰もが聞いたことがあるでしょう。 コンピューター画面の最も重要な特性の 1 つは、単なる解像度ではなく、解像度です。 単位長さあたりに何ピクセルあるかを示します。 通常、モニターの解像度は 1 インチあたりのピクセル数で測定されます。 単位長さあたりのピクセル数が多いほど、「粒子」が減少するため、品質が高くなります。

オーディオストリーム処理

テキストおよびオーディオ情報のコーディングには、他のタイプのコーディングと同様に、いくつかの特徴があります。 ここでは、最後のプロセスであるオーディオ情報のエンコードについて説明します。

オーディオ ストリーム (および個々のサウンド) の表現は、2 つの方法を使用して生成できます。

アナログ形式の音声情報表現

この場合、量は実に膨大な数の異なる値をとる可能性があります。 さらに、これらの同じ値は一定のままではなく、非常に急速に変化し、このプロセスは継続的です。

オーディオ情報の離散形式の表現

離散法について話す場合、この場合、数量は限られた数の値のみを取ることができます。 この場合、変化は発作的に発生します。 音声だけでなくグラフィック情報も離散的にエンコードできます。 ちなみにアナログ形式に関しては。

アナログオーディオ情報は、たとえばビニールレコードに保存されます。 しかし、CD はすでにオーディオ情報を表現する個別の方法です。

一番最初に、コンピューターはすべての情報を機械語で認識するという事実について話しました。 これを行うために、情報は一連の電気インパルス (0 と 1) の形式でエンコードされます。 オーディオ情報のエンコードもこの規則の例外ではありません。 コンピュータでサウンドを処理するには、まずサウンドをまさにそのシーケンスに変換する必要があります。 この後のみ、ストリームまたは単一のサウンドに対して操作を実行できます。

エンコード プロセスが発生すると、ストリームはタイム サンプリングの対象になります。 音波は連続的であり、短い時間にわたって発達します。 振幅値は、特定の間隔ごとに個別に設定されます。

結論

それで、この記事で何が分かりましたか? まず、コンピューターのモニターに表示される情報はすべて、そこに表示される前にエンコードされます。 第二に、このコーディングには情報を機械語に翻訳することが含まれます。 第三に、機械語は一連の電気インパルス (0 と 1) にすぎません。 4 番目に、異なる文字をエンコードするための個別のテーブルがあります。 そして第 5 に、グラフィック情報とサウンド情報をアナログの個別形式で表示できます。 おそらくここが、これまで議論してきた主なポイントです。 この分野を研究する学問の 1 つはコンピューター サイエンスです。 文字情報のコーディングとその基礎は難しいことは何もないので学校で説明されます。

一般的な概念

定義 1

コーディング- これは、ある表現形式から、保存、送信、または処理に最も便利な別の表現形式への情報の変換です。

定義 2

コードこれは、ある文字セットを別の文字セットに表示するためのルールと呼ばれます。

定義 3

バイナリコードは、$0$ と $1$ という 2 つの記号を使用して情報を表す方法です。

定義 4

コード長– エンコードされた情報を表すために使用される文字の数。

定義5

少し 1 つの 2 進数 $0$ または $1$ です。 1 ビットで $1$ または $0$ の 2 つの値をエンコードできます。 2 ビットを使用すると、$00$、$01$、$10$、$11$ の 4 つの値をエンコードできます。 3 ビットは $8$ の異なる値をエンコードします。 1 ビット追加すると、エンコードできる値の数が 2 倍になります。

写真1。

情報エンコーディングの種類

情報コーディングには次の種類があります。

  • カラーコーディング。
  • 数値情報のコーディング。
  • 音声情報のコーディング。
  • ビデオのエンコード。

テキスト情報のエンコード

あらゆるテキストは一連の文字で構成されます。 記号には、文字、数字、句読点、数学記号、丸括弧、角括弧などが含まれます。

テキスト情報は、他の情報と同様に、バイナリ形式でコンピュータのメモリに保存されます。 これを行うために、それぞれに、と呼ばれる特定の非負の数値が割り当てられます。 文字コード、この数値はバイナリ形式でコンピュータのメモリに書き込まれます。 シンボルとそのコードの間の特定の関係は次のように呼ばれます。 コーディングシステム。 パーソナル コンピュータは通常、ASCII (American Standard Code for Informational Interchange) エンコーディング システムを使用します。

注1

ソフトウェア開発者は、独自の 8$ ビットのテキスト エンコード標準を作成しました。 追加ビットにより、エンコード範囲は $256$ 文字まで拡張されました。 混乱を避けるため、このようなエンコーディングの最初の $128$ 文字は、原則として ASCII 標準に対応します。 残りの $128$ は地域言語機能を実装します。

注2

私たちの国で一般的な 8 ビット エンコーディングは、KOI8、UTF8、Windows-1251 などです。

カラーコーディング

写真をバイナリ コードで保存するには、まず写真を仮想的に、と呼ばれる多数の小さな色のドットに分割します。 ピクセル(モザイクのようなもの)。 各ピクセルの色はドットに分解されるとバイナリ コードにエンコードされ、ストレージ デバイスに保存されます。

例1

たとえば、画像のサイズが 512 ドル x 512 ピクセルである場合、これは、262,144 ドルのピクセル (垂直ピクセル数と水平ピクセル数の積) で構成されるマトリックスであることを意味します。

例 2

画像をピクセルに「分割」するデバイスは、最新のカメラ (Web カメラ、携帯電話のカメラを含む) またはスキャナです。 たとえば、カメラの特性が「$10$ メガ ピクセル」である場合、このカメラがバイナリ コードで記録するために画像を分割するピクセル数は 1000 万です。 画像がより多くのピクセルに分割されるほど、デコードされた形式で (モニター上または印刷後) 写真がよりリアルに見えます。

ただし、写真をバイナリ コードにエンコードする品質は、ピクセル数だけでなく、色の多様性にも依存します。 バイナリコードで色を記録するためのアルゴリズムいくつかあります。 最も一般的なのは RGB。 この略語は、三原色の名前の頭文字をとったものです: 赤 - 英語赤、 緑 - 英語 緑、 青 - 英語 青。 これら 3 つの色を異なる割合で混合すると、他の色や色合いを得ることができます。

これが RGB アルゴリズムの基礎になっています。 各ピクセルは、その形成に関与する赤、緑、青の量を示すバイナリ コードで書き込まれます。

ピクセルのエンコードに割り当てられるビットが多いほど、これら 3 つのチャネルを混合するためのオプションがより多く使用できるようになり、画像の彩度が高くなります。

定義6

画像を構成するピクセルの色の多様性を次のように呼びます。 色深度.

グラフィック情報のエンコード

小さなドットから画像を形成する上記の技術は最も一般的であり、 ラスター 。 しかし、コンピュータはラスター グラフィックスに加えて、いわゆる ベクターグラフィックス .

ベクター イメージはコンピューターのみを使用して作成され、ピクセルではなくグラフィック プリミティブ (線、多角形、円など) から形成されます。

ベクターグラフィックスは描画グラフィックスです。 コンピューターでの「描画」に非常に便利で、巨大な広告ポスターの作成など、印刷物のグラフィックデザインやその他の同様の場面でデザイナーによって広く使用されています。 バイナリ コードのベクトル イメージは、サイズ、塗りつぶしの色、キャンバス上の位置、およびその他のプロパティを示すプリミティブのコレクションとして記述されます。

例 3

円のベクトル画像を記憶装置に記録するには、コンピュータはオブジェクト (円) の種類、キャンバス上の中心の座標、半径の長さ、太さと色をバイナリ コードでエンコードするだけで済みます。線と塗りつぶしの色。

ラスター システムでは、各ピクセルの色をエンコードする必要があります。 また、画像のサイズが大きい場合は、それを保存するためにかなり多くのストレージ容量が必要になります。

ただし、ベクトル エンコード方式では、リアルな写真をバイナリ コードで書き込むことはできません。 したがって、すべてのカメラはラスター グラフィックスの原理でのみ動作します。 平均的なユーザーは日常生活でベクター グラフィックスを扱う必要はほとんどありません。

数値情報のエンコード

数値をエンコードするときは、その数値がシステムに入力された目的 (算術計算のためか、単に出力のためか) が考慮されます。 バイナリ システムでエンコードされたすべてのデータは、1 と 0 を使用して暗号化されます。 これらの記号はとも呼ばれます ビット。 このエンコード方法は、技術的に整理するのが最も簡単であるため、最も一般的です。信号の存在は $1$、不在は $0$ です。 バイナリ暗号化には、シンボルの組み合わせの長さという欠点が 1 つだけあります。 しかし、技術的な観点から見ると、少数のより複雑なコンポーネントを操作するよりも、単純で類似したコンポーネントを多数操作する方が簡単です。

注3

整数は、数値をある記数法から別の記数法に変換するだけでエンコードされます。 実数をエンコードするには、$80$-bit エンコードが使用されます。 この場合、数値は標準形式に変換されます。

音声情報のエンコード

定義7

人が聞くあらゆる音は空気振動であり、周波数と振幅という 2 つの主要な指標によって特徴付けられます。 発振振幅- これは、振動ごとの初期状態からの空気の状態の偏差の程度です。 私たちはそれを音の大きさとして認識します。 振動周波数は、単位時間当たりの大気状態の初期状態からの偏差の数です。 それは音の高さとして認識されます。

例 4

したがって、静かな蚊の鳴き声は、周波数は高いものの、振幅は小さい音です。 反対に、雷雨の音は振幅は大きくなりますが、周波数は低くなります。

コンピューターがサウンドを扱う仕組みは、一般的に次のように説明できます。 マイクは空気振動を同様の特性を持つ電気振動に変換します。 コンピュータのサウンド カードは電気振動をバイナリ コードに変換し、記憶装置に保存します。 このような録音を再生すると、逆のプロセス (デコード) が発生し、バイナリ コードが電気振動に変換され、オーディオ システムまたはヘッドフォンに入力されます。 スピーカーやヘッドフォンはマイクとは逆の効果があります。 電気振動を空気振動に変換します。

音波を小さなセクションに分割する原理は、バイナリ オーディオ コーディングの基礎です。 コンピュータのオーディオ カードは、サウンドを非常に小さな時間セグメントに分割し、それぞれの強度をバイナリ コードにエンコードします。 この音を部分に分割することをサンプリングと呼びます。 サンプリング周波数が高いほど、音波の形状がより正確に記録され、記録の品質が向上します。

定義8

録音の品質は、サンプリングから得られるオーディオの各セクションをエンコードするためにコンピューターが使用するビット数にも大きく依存します。 サンプリングから得られるオーディオの各セクションをエンコードするために使用されるビット数は、と呼ばれます。 音の深さ.

ビデオエンコーディング

ビデオ録画は 2 つのコンポーネントで構成されます。 そして グラフィック .

ビデオ ファイルのオーディオ トラックのバイナリ コードへのエンコードは、通常のオーディオ データのエンコードと同じアルゴリズムを使用して実行されます。 ビデオ エンコードの原理は、ラスター グラフィックス エンコード (前述) に似ていますが、いくつかの特徴があります。 ご存知のとおり、ビデオ録画は、急速に変化する一連の静止画像 (フレーム) です。 1 秒のビデオは $25$ 以上の写真で構成されます。 同時に、次の各フレームは前のフレームとわずかに異なります。

この機能を考慮すると、ビデオ エンコード アルゴリズムは、原則として、最初の (ベース) フレームのみを記録します。 後続の各フレームは、前のフレームとの違いを記録することによって形成されます。

ベクトル画像とフラクタル画像。

ベクトル画像基本セグメントと円弧で構成されるグラフィック オブジェクトです。 画像の基本要素は線です。 他のオブジェクトと同様に、形状 (直線、曲線)、厚さ、色、スタイル (点線、実線) のプロパティがあります。 閉じた線には、(他のオブジェクトまたは選択した色のいずれかで) 塗りつぶされる特性があります。 他のすべてのベクター グラフィックス オブジェクトは線で構成されます。 線は数学的に単一のオブジェクトとして記述されるため、ベクトル グラフィックスを使用してオブジェクトを表示するためのデータ量は、ラスター グラフィックスよりもはるかに少なくなります。 ベクトル画像に関する情報は通常の英数字としてエンコードされ、特別なプログラムによって処理されます。

ベクター グラフィックを作成および処理するためのソフトウェア ツールには、次の GR が含まれます。CorelDraw、Adobe Illustrator、およびラスター イメージをベクター イメージに変換するための特殊なパッケージであるベクタライザー (トレーサー) です。

フラクタルグラフィックスベクトルなどの数学的計算に基づいています。 ただし、ベクトルとは異なり、その基本要素は数式そのものです。 これにより、コンピュータのメモリにはオブジェクトが保存されず、画像は方程式のみを使用して構築されるという事実が生じます。 この方法を使用すると、最も単純な規則的な構造だけでなく、風景を模倣した複雑なイラストも構築できます。

タスク。

コンピュータのビデオ メモリの容量は 512 KB であることが知られています。 画面解像度は 640 x 200 です。パレットを使用してビデオ メモリに同時に配置できる画面ページの数
a) 8色から。
b) 16 色。
c) 256 色?

130 階調に関する情報をエンコードするには何ビットが必要ですか? 7 ビットでは 0 ~ 127 の色相番号を保存でき、8 ビットでは 0 ~ 255 の色相番号を保存できるため、8 (つまり 1 バイト) を計算するのは難しくありません。このエンコード方法が次のとおりであることが簡単にわかります。最適ではありません: 130 は 255 よりも明らかに小さいです。次のことがわかっている場合、図面をファイルに書き込むときに図面に関する情報を圧縮する方法について考えてみましょう。
a) 図面には、可能な 138 色のうち 16 色しか同時に含まれていません。
b) 図面には 130 のシェードすべてが同時に含まれていますが、異なるシェードでペイントされたドットの数は大きく異なります。

A) 16 階調に関する情報を保存するには 4 ビット (半バイト) で十分であることは明らかです。 ただし、この 16 色は 130 色の中から選択されるため、4 ビットに収まらない数値が含まれる場合があります。 そこでパレット方式を使います。 描画で使用する 16 のシェードに 1 から 15 までの「ローカル」番号を割り当て、バイトあたり 2 ポイントの割合で描画全体をエンコードしましょう。 次に、この情報に (情報を含むファイルの最後に) シェード番号を含む 16 組のバイトで構成される対応表を追加します。1 バイトはこの図の「ローカル」番号で、2 番目は実際の数値です。この色合い。 (後者の代わりに、色相そのものについてのエンコードされた情報、たとえばブラウン管の「電子銃」の赤、緑、青の輝きの明るさに関する情報が使用される場合、そのようなテーブルは次のようになります。カラーパレット)。 図面が十分に大きい場合、結果として得られるファイル サイズは大幅に増加します。
b) 図面に関する情報をアーカイブするための最も単純なアルゴリズムを実装してみましょう。 最小数の点がペイントされる 3 つのシェードにコード 128 ~ 130 を割り当て、残りのシェードにコード 1 ~ 127 を割り当てます。 1 から 127 までの番号を持つシェードの 7 ビット コードをファイル (この場合はバイトのシーケンスではなく、連続したビット ストリーム) に書き込みます。ビット ストリームの残りの 3 つのシェードについては、符号番号 - 7 ビット 0 - の直後に 2 ビットの「ローカル」数値が続き、ファイルの最後に「ローカル」数値と実数の対応表を追加します。 コード 128 ~ 130 の色合いはまれであるため、7 ビットのゼロはほとんどありません。

この問題で質問をすることは、画像の色構成を参照せずに他の解決策を排除するものではないことに注意してください。アーカイブ:
a) 同じ色合いでペイントされた点のシーケンスを識別し、これらのシーケンスのそれぞれを数値 (色)、(数量) のペアで置き換えることに基づいています (この原則は PCX グラフィック形式の基礎となっています)。
b) ピクセルラインを比較することにより (最初のページ全体の点のシェード番号を記録し、後続の行では、ページ内の同じ位置にある点のシェードとシェードが異なる点のみのシェード番号を記録します)前の行 - これは GIF 形式の基礎です);
c) フラクタル画像パッケージ化アルゴリズム (YPEG 形式) を使用します。 (IO 6、1999)

時計のチクタク音やエンジンの音、風の音や木の葉のそよぐ音、鳥のさえずりや人の声など、世界にはさまざまな音が溢れています。 人々は、音がどのように生まれ、それが何を表しているのかをずっと昔から推測し始めていました。 古代ギリシャの哲学者であり科学者である百科事典のアリストテレスでさえ、観察に基づいて音の性質を説明し、音を発する物体は空気の圧縮と希薄化を交互に引き起こすと信じていました。 したがって、振動する弦は空気を放出または圧縮し、空気の弾性により、これらの交互の効果がさらに空間に伝わり、層から層へと弾性波が発生します。 それらが私たちの耳に到達すると、鼓膜に衝撃を与え、音の感覚を引き起こします。

人は耳で、16 Hz ~ 20 kHz (1 Hz - 1 秒あたり 1 回の振動) の範囲の周波数を持つ弾性波を知覚します。 これに従って、周波数が指定された範囲内にあるあらゆる媒質中の弾性波は、音波または単に音と呼ばれます。 音の研究では、次のような概念が考えられます。 トーンそして 音色音。 楽器の演奏であれ人間の声であれ、実際の音はすべて、特定の周波数セットを持つ多くの倍音振動の独特な混合物です。

最も低い周波数を持つ振動を次のように呼びます。 メイントーン、他の - 倍音。

音色- 特定の音に固有の倍音の数が異なり、それが特別な色付けを与えます。 音色の違いは番号だけでなく、基音の音に伴う倍音の強さによっても決まります。 私たちがピアノとヴァイオリン、ギターとフルートの音を簡単に区別したり、馴染みのある人の声を認識したりできるのは、音色によってです。

音楽の音は、次の 3 つの性質によって特徴付けることができます。音色、つまり振動の形状に依存する音の色、1 秒あたりの振動数 (周波数) によって決定されるピッチ、および音の強さに応じた音量です。振動。

現在、コンピュータはさまざまな分野で広く利用されています。 音情報や音楽の処理も例外ではありませんでした。 1983 年まで、録音された音楽はすべてビニール レコードとコンパクト カセットでリリースされました。 現在、CD は広く普及しています。 スタジオ サウンド カードがインストールされ、MIDI キーボードとマイクが接続されたコンピュータがある場合は、専用の音楽ソフトウェアを使用して作業できます。

従来、それはいくつかのタイプに分類できます。

1) 特定のサウンド カードおよび外部デバイスで動作するように設計されたあらゆる種類のユーティリティおよびドライバー。
2) オーディオ エディタは、サウンド ファイルを操作するように設計されており、サウンド ファイルを部分に分割したり、エフェクトを使用して処理したりするなど、あらゆる操作を実行できます。
3) ソフトウェア シンセサイザー。比較的最近に登場し、強力なコンピュータでのみ正しく動作します。 さまざまなサウンドを作成して実験することができます。
その他。

最初のグループには、すべてのオペレーティング システム ユーティリティが含まれます。 たとえば、Win 95 および 98 には、サウンドの再生/録音、CD および標準 MIDI ファイルの再生のための独自のミキサー プログラムとユーティリティがあります。 サウンド カードをインストールした後、これらのプログラムを使用してその機能を確認できます。 たとえば、Phonograph プログラムは、wave ファイル (Windows 形式の録音ファイル) を操作するように設計されています。 これらのファイルの拡張子は .WAV です。 このプログラムは、テープ レコーダーで使用されるものと同様の技術を使用して、サウンド録音を再生、録音、編集する機能を提供します。 蓄音機を使用するには、マイクをコンピュータに接続することをお勧めします。 サウンドを録音する必要がある場合は、サウンドの録音時間が左右されるため、音質を決定する必要があります。 録音品質が高くなるほど、可能なサウンド持続時間は短くなります。 平均的な録音品質では、音声を十分に録音でき、最大 60 秒の長さのファイルを作成できます。 録音時間は約6秒と音楽CD並みの音質です。

オーディオのエンコードはどのように機能しますか? 私たちは子供の頃から、レコード、カセット、CDなど、さまざまなメディアでの音楽の録音に触れてきました。 現在、サウンドを録音するには主に 2 つの方法があります。 アナログとデジタル。しかし、音を媒体に記録するには、音を電気信号に変換する必要があります。

これはマイクを使用して行われます。 最も単純なマイクには、音波の影響で振動する膜が付いています。 コイルが膜に取り付けられており、磁場中で膜と同期して動きます。 コイルには交流電流が発生します。 電圧変化は音波を正確に反映します。

マイクの出力に現れる交流電流を アナログ信号。 電気信号に適用される場合、「アナログ」とは、信号が時間と振幅において連続していることを意味します。 空気中を伝わる音波の形状を正確に反映します。

オーディオ情報は、離散形式またはアナログ形式で表現できます。 それらの違いは、情報の離散表現では、物理量が突然変化し (「はしご」)、有限の値セットを取ることです。 情報がアナログ形式で表現される場合、物理量は継続的に変化する無限の値を取ることができます。

ビニールレコードは、サウンドトラックの形状が継続的に変化するため、サウンド情報のアナログストレージの一例です。 しかし、磁気テープへのアナログ録音には、媒体の劣化という大きな欠点があります。 通常レベルの高周波を持っていたレコードは、1 年も経つと高周波が失われる可能性があります。 ビニールレコードは再生すると何度か品質が低下します。 したがって、デジタル録音が優先されます。

80 年代初頭には、コンパクト ディスクが登場しました。 CD のオーディオ トラックにはさまざまな反射率の領域が含まれているため、これらはオーディオ情報の個別の保存の一例です。 理論上、これらのデジタル ディスクは、傷がなければ永久に保存できます。 その利点は、耐久性と機械的老化に対する耐性です。 デジタルダビング時に音質が劣化しないのもメリットです。

マルチメディア サウンド カードには、アナログ マイク プリアンプとミキサーがあります。

オーディオ情報のデジタルからアナログへの変換、およびアナログからデジタルへの変換。

サウンドをアナログからデジタル、またはその逆に変換するプロセスを簡単に見てみましょう。 サウンド カードで何が起こっているのかを大まかに把握しておくと、オーディオを扱う際の間違いを避けることができます。

音波は、マイクを使用してアナログ交流電気信号に変換されます。 信号はオーディオ パス (付録図 1.11、図 1 を参照) を通過し、信号をデジタル形式に変換するデバイスであるアナログ デジタル コンバーター (ADC) に入ります。

簡略化すると、ADC の動作原理は次のようになります。一定の間隔で信号の振幅を測定し、振幅の変化に関する情報を運ぶ一連の数値をデジタル パスに沿って送信します (付録の図 1.11、スキーム 2 を参照)。 )。

アナログからデジタルへの変換中は、物理的な変換は行われません。 あたかも指紋やサンプルが電気信号から採取されるかのようであり、電気信号はオーディオ パスの電圧変動のデジタル モデルです。 これを図の形式で表す場合、このモデルは一連の列として表され、それぞれが特定の数値に対応します。 デジタル信号はその性質上離散的、つまり断続的であるため、デジタル モデルはアナログ信号の形状と正確には一致しません。

サンプルは、アナログ信号の振幅の 2 つの測定間の時間間隔です。

サンプルは英語から直訳すると「サンプル」となります。 マルチメディアおよびプロのオーディオ用語では、この単語にはいくつかの意味があります。 サンプルは、期間に加えて、アナログからデジタルへの変換を通じて取得されるデジタル データのシーケンスとも呼ばれます。 変換プロセス自体は次のように呼ばれます。 サンプリング。ロシアの専門用語ではこう呼ばれます サンプリング。

デジタル オーディオは、デジタル - アナログ コンバーター (DAC) を使用して出力されます。DAC は、入力デジタル データに基づいて、適切なタイミングで必要な振幅の電気信号を生成します (付録の図 1.11、図 3 を参照)。

オプション サンプリング

重要なパラメータ サンプリング周波数とビット深度です。
頻度- 1 秒あたりのアナログ信号振幅測定の数。

サンプリング周波数が可聴帯域の上限周波数の 2 倍以下の場合、高周波で損失が発生します。 これは、オーディオ CD の標準周波数が 44.1 kHz である理由の説明になります。 音波の振動範囲は 20 Hz ~ 20 kHz であるため、1 秒あたりの信号測定数は、同じ期間内の振動数よりも大きくなければなりません。 サンプリング周波数が音波の周波数よりも大幅に低い場合、信号の振幅は測定間の時間内に数回変化する時間があり、デジタル指紋が無秩序なデータのセットを保持するという事実につながります。 デジタルからアナログへの変換中、このようなサンプルは主信号を伝送せず、ノイズのみを生成します。

新しいオーディオ DVD フォーマットでは、信号は 1 秒間に 96,000 回測定されます。 96 kHz のサンプリング周波数が使用されます。 マルチメディア アプリケーションでハードディスクのスペースを節約するために、11、22、32 kHz の低い周波数がよく使用されます。 これは可聴周波数範囲の減少につながり、聞こえる音に強い歪みが生じることを意味します。

同じサウンドを 1 kHz (ピアノの第 7 オクターブまでの音がこの周波数にほぼ対応します) でグラフ化したが、異なる周波数でサンプリングした場合 (正弦波の底部はすべてのグラフに示されているわけではありません)、その違いは次のようになります。が見えるようになります。 時間を示す横軸の1目盛りが10サンプルに相当します。 スケールは同じです (付録図 1.13 を参照)。 11 kHz では、50 サンプルごとに約 5 つの音波振動があることがわかります。これは、1 つの正弦波周期がわずか 10 個の値で表されることを意味します。 これはかなり不正確なレンダリングです。 同時に、44 kHz のデジタル化周波数を考慮すると、正弦波の各周期にはすでにほぼ 50 のサンプルが存在します。 これにより、高品質の信号を取得できます。

ビット深度アナログ信号の振幅変化がどの程度の精度で発生するかを示します。 デジタル化中に各瞬間の信号振幅値が送信される精度によって、デジタル - アナログ変換後の信号の品質が決まります。 波形再構成の信頼性はビット深度に依存します。

振幅値を符号化するには、バイナリ符号化の原理が使用されます。 音声信号は、一連の電気パルス (バイナリの 0 と 1) として表現される必要があります。 通常、振幅値の 8、16 ビット、または 20 ビット表現が使用されます。 連続オーディオ信号をバイナリ コーディングすると、一連の離散信号レベルに置き換えられます。 エンコードの品質は、サンプリング周波数 (単位時間あたりの信号レベルの測定数) に依存します。 サンプリング周波数が増加すると、情報のバイナリ表現の精度が向上します。 周波数 8 kHz (1 秒あたりのサンプル数 8,000) では、サンプリングされたオーディオ信号の品質はラジオ放送の品質に相当し、周波数 48 kHz (1 秒あたりのサンプル数 48,000) では音質に相当します。オーディオ CD の。

8 ビット エンコードを使用すると、デジタル デバイスのダイナミック レンジ (2 8 = 256) の最大 1/256 のアナログ信号振幅精度を達成できます。

オーディオ信号の振幅値を表すために 16 ビットエンコーディングを使用すると、測定精度は 256 倍に向上します。

最新のコンバータは通常、20 ビット信号エンコードを使用しており、これにより高品質のオーディオ デジタル化が可能になります。

K = 2 a という公式を覚えておきましょう。 ここで、K は、サウンドをビットでエンコードすることで取得できる、考えられるすべてのサウンドの数 (さまざまな信号レベルまたは状態の数) です。

私たちは数値体系、つまり数値をエンコードする方法について学びました。 数字は項目の数に関する情報を示します。 この情報はエンコードされ、何らかの数値体系で表示される必要があります。 既知の方法のどれを選択するかは、解決する問題によって異なります。
最近まで、コンピュータは主に数値情報と文字情報を処理していました。 しかし、人は外界に関するほとんどの情報を画像と音声の形で受け取ります。 この場合、イメージの方が重要であることがわかります。 「百回聞くよりも一度見た方が良い」ということわざを思い出してください。 そのため、今日ではコンピュータが画像や音声をより積極的に扱うようになってきています。 このような情報をエンコードする方法については、今後必ず検討していきます。

数値情報とテキスト情報のバイナリコーディング。

コンピューターでは、あらゆる情報は 0 と 1 の 2 桁のシーケンスを使用してエンコードされます。コンピューターは情報を電気信号の組み合わせの形で保存および処理します。電圧 0.4V ~ 0.6V は論理ゼロに対応し、電圧 2.4V ~ 2.7V は論理ゼロに対応します。 V は論理 1 に対応します。 0 と 1 のシーケンスが呼び出されます。 バイナリコード 、数字の 0 と 1 は ビット (2進数)。 コンピュータ上のこの情報のエンコードは、 バイナリコーディング 。 したがって、バイナリ符号化は、可能な限り最小限の基本シンボルを使用して符号化し、最も単純な手段で符号化することです。 これが、理論的な観点から注目に値する理由です。
技術的に実装が簡単なため、エンジニアは情報のバイナリ コーディングに魅力を感じます。 バイナリ コードを処理する電子回路は、次の 2 つの状態のうちの 1 つのみでなければなりません。 信号がある / 信号がない または 高圧/低圧 .
彼らの仕事では、コンピュータは 2、4、8、さらには 10 バイトの形式で表現される実数と整数を操作します。 数を数えるときに数値の符号を表すには、追加の 符号桁 、通常は数字の前に配置されます。 正の数の場合、符号ビットの値は 0 で、負の数の場合は - 1 です。負の整数 (-N) の内部表現を書き込むには、次の手順を実行する必要があります。
1) 0 を 1 に、1 を 0 に置き換えて、数値 N の追加コードを取得します。
2) 得られた数値に 1 を加えます。

この数値を表すには 1 バイトでは不十分なため、2 バイトまたは 16 ビットで表され、その補数コードは 1111101111000101、つまり -1082=1111101111000110 になります。
PC がシングルバイトしか扱えないとしたら、ほとんど役に立ちません。 実際には、PC は 2、4、8、さらには 10 バイトで書かれた数値を処理します。
60 年代後半以降、テキスト情報を処理するためにコンピューターがますます使用されるようになりました。 テキスト情報を表すには、通常、ラテンアルファベットの大文字と小文字、数字、句読点など、256 個の異なる文字が使用されます。 最新のコンピューターでは、各文字は 8 つの 0 と 1 のシーケンスに対応します。 バイト .
バイトは、0 と 1 の 8 ビットの組み合わせです。
これらの電子コンピュータで情報をエンコードする場合、8 つの 0 と 1 からなる 256 の異なるシーケンスが使用され、これにより 256 文字をエンコードできます。 たとえば、ロシア語の大きな文字「M」のコードは 11101101、文字「I」のコードは 11101001、文字「P」のコードは 11110010 です。したがって、単語「WORLD」は 24 ビットのシーケンスでエンコードされます。または 3 バイト: 111011011110100111110010。
メッセージのビット数をメッセージ情報量と呼びます。 これは面白い!

当初、コンピュータではラテン文字のみが使用されていました。 26文字あります。 したがって、それぞれを指定するには 5 つのパルス (ビット) で十分です。 しかし、テキストには句読点や小数などが含まれています。したがって、最初の英語コンピュータでは、1 バイト (機械音節) には 6 ビットが含まれていました。 それから7つ目は、大きな文字と小さな文字を区別するだけでなく、プリンター、信号灯、その他の機器の制御コードの数を増やすことです。 1964 年に強力な IBM-360 が登場し、バイトは最終的に 8 ビットになりました。 最後の 8 ビットは擬似グラフィック文字に必要でした。
特定のバイナリ コードをシンボルに割り当てるのは慣例の問題であり、コード テーブルに記録されます。 残念ながら、ロシア文字には 5 つの異なるエンコーディングがあるため、あるエンコーディングで作成されたテキストは別のエンコーディングでは正しく反映されません。
歴史的に見て、コンピューター上でロシア文字をエンコードするための最初の標準の 1 つは KOI8 (「情報交換コード、8 ビット」) でした。 最も一般的なエンコーディングは、標準の Microsoft Windows キリル文字エンコーディングであり、略語 SR1251 で示されます (「SR」は「コード ページ」または「コード ページ」の略です)。 Apple は、Macintosh コンピュータ用にロシア文字 (Mac) の独自のエンコーディングを開発しました。 国際標準化機構 (ISO) は、ISO 8859-5 エンコーディングをロシア語の標準として承認しました。 最後に、新しい国際標準 Unicode が登場しました。Unicode では、各文字に 1 バイトではなく 2 バイトが割り当てられるため、256 文字ではなく 65536 文字までエンコードできます。
これらのエンコードはすべて、128 文字をエンコードする ASCII (American Standard Code for Information Interchange) コード テーブルを継承しています。

ASCII 文字テーブル:

コード シンボル コード シンボル コード シンボル コード シンボル コード シンボル コード シンボル
32 空間 48 . 64 @ 80 P 96 " 112 p
33 ! 49 0 65 81 Q 97 ある 113 q
34 " 50 1 66 B 82 R 98 b 114 r
35 # 51 2 67 C 83 S 99 c 115 s
36 $ 52 3 68 D 84 T 100 d 116 t
37 % 53 4 69 E 85 U 101 e 117 あなた
38 & 54 5 70 F 86 V 102 f 118 v
39 " 55 6 71 G 87 W 103 g 119 w
40 ( 56 7 72 H 88 バツ 104 h 120 バツ
41 ) 57 8 73 89 Y 105 121 y
42 * 58 9 74 J 90 Z 106 j 122 z
43 + 59 : 75 K 91 [ 107 k 123 {
44 , 60 ; 76 L 92 \ 108 124 |
45 - 61 < 77 M 93 ] 109 メートル 125 }
46 . 62 > 78 N 94 ^ 110 n 126 ~
47 / 63 ? 79 95 _ 111 ああ 127 デル

テキストのバイナリ コーディングは次のように行われます。キーを押すと、特定の電気インパルスのシーケンスがコンピュータに送信され、各文字は独自の電気インパルスのシーケンス (機械語では 0 と 1) に対応します。 キーボードおよびスクリーン ドライバー プログラムは、コード テーブルを使用して文字を決定し、画面上にそのイメージを作成します。 したがって、テキストと数字はバイナリ コードでコンピュータのメモリに保存され、プログラムによって画面上の画像に変換されます。

グラフィック情報のバイナリコーディング。

80年代以降、コンピュータ上でグラフィック情報を処理する技術が急速に発展しました。 コンピュータグラフィックスは、科学研究、コンピュータシミュレーション、コンピュータアニメーション、ビジネスグラフィックス、ゲームなどのコンピュータシミュレーションで広く使用されています。
表示画面上のグラフィック情報は、ドット(ピクセル)から構成される画像の形で表現されます。 新聞の写真をよく見ると、それも小さな点で構成されていることがわかります。 これらが白と黒のドットのみの場合、それぞれを 1 ビットでエンコードできます。 ただし、写真に色合いがある場合、2 ビットで 4 つのドットの色合い (00 - 白、01 - ライト グレー、10 - ダーク グレー、11 - 黒) をエンコードできます。 3 ビットで 8 階調などをエンコードできます。
1 つの色の色合いをエンコードするのに必要なビット数は、色深度と呼ばれます。

現代のコンピューターでは 解決 (画面上のドットの数)、色の数はビデオ アダプタによって異なり、ソフトウェアで変更できます。
カラー画像には、16 色、256 色、65536 色 ( ハイカラー)、16777216色( 天然色)。 モードのポイントごと ハイカラー 16 ビットまたは 2 バイトが必要です。
最も一般的な画面解像度は 800 x 600 ピクセルです。 480000ポイント。 ハイカラー モードに必要なビデオ メモリの量を計算してみましょう: 2 バイト *480000=960000 バイト。
情報量の測定には、より大きな単位も使用されます。


したがって、960000 バイトは約 937.5 KB に相当します。 人が 1 日 8 時間休憩なしで話すと、70 年間の人生で約 10 ギガバイトの情報を話すことになります (500 万ページ、高さ 500 メートルの紙の束に相当します)。
情報転送速度は、1 秒あたりに送信されるビット数です。 1 秒あたり 1 ビットの伝送速度は 1 ボーと呼ばれます。

バイナリ画像コードであるビットマップはコンピュータのビデオ メモリに保存され、プロセッサによって (1 秒あたり少なくとも 50 回) 読み取られて、画面に表示されます。


音声情報をバイナリコーディングします。

90 年代初頭以来、パーソナル コンピューターはオーディオ情報を処理できるようになりました。 サウンド カードを備えたすべてのコンピュータでは、ファイルとして保存できます ( ファイルはディスク上に保存される一定量の情報であり、名前が付いています。 ) して音声情報を再生します。 専用のソフトウェア(オーディオファイルエディター)を使用すると、サウンドファイルの作成、編集、視聴の可能性が広がります。 音声認識プログラムも開発されており、音声でコンピュータを制御できるようになる。
アナログ信号を個別のレコードに変換し、逆に「デジタル化された」サウンドをスピーカー入力に送られるアナログ (連続) 信号に変換するのはサウンド カード (カード) です。


アナログオーディオ信号をバイナリコーディングする場合、連続信号がサンプリングされます。 は、一連の個々のサンプル、つまり読み取り値に置き換えられます。 バイナリ エンコーディングの品質は、離散信号レベルの数と 1 秒あたりのサンプル数の 2 つのパラメータに依存します。 オーディオ アダプタのサンプル数またはサンプリング周波数は、11 kHz、22 kHz、44.1 kHz など、異なる場合があります。レベル数が 65536 の場合、1 つのオーディオ信号に対して 16 ビット (216) が設計されます。 16 ビット オーディオ アダプタは、8 ビット オーディオ アダプタよりも正確にオーディオをエンコードして再生します。
1 つのオーディオ レベルをエンコードするのに必要なビット数は、オーディオ深度と呼ばれます。
モノラル オーディオ ファイルのボリューム (バイト単位) は、次の式で決定されます。


ステレオサウンドの場合、オーディオ ファイルの音量は 2 倍になり、クアドラフォニック サウンドの場合は 4 倍になります。
プログラムの複雑化・高機能化やマルチメディアアプリケーションの出現に伴い、プログラムやデータの機能量は増大しています。 80 年代半ばにはプログラムとデータの通常の量が数十キロバイト、場合によっては数百キロバイトだった場合、90 年代半ばには数十メガバイトになり始めました。 それに応じて RAM の量も増加します。


トピックの続き:
その他

これは、検索では検索フレーズに完全に一致する人気のツイートが返されることはないためです。 それでも、必要な情報は必ず入手できるのでご安心ください...