XYZ解析 - バリエーションの装実的 - 予測へのデータの作成。

私たちは、分散、標準偏差、そしてもちろん変動係数としてのそのような値の計算に直面しなければなりません。 特別な注意を払うのは後者の計算であることは正確です。 毎回のみが始まるのは、すべての新人が 表図編集、私は値の散乱の相対的な境界線をすばやく計算することができました。

バリエーション比率は何ですか、それは何に必要ですか?

だから、それは私のようです、それは小さな理論的な遠足になる価値があり、変動係数の性質を理解するでしょう。 このインジケータは、平均値に対するデータの範囲を反映するために必要です。 つまり、標準偏差の平均値に対する比率を示します。 変動係数は、百分率の用語で測定し、それと一時的な行の均一性を表示するようにします。

特定のサンプルからのデータの予測をする必要がある場合、バリエーション係数は不可欠なアシスタントになります。 このインジケータは、その後の予測に最も有用な値の主なランクを割り当て、サンプルをわずかな要因から洗浄する。 したがって、係数の値が0%であることがわかる場合は、信頼度で、行が同種であることを宣言しているため、すべての値は別の値と同じです。 変動係数が33%のマークより大きい値をとると、これはあなたが平均サンプリングとは大きく異なる不均一な近くを扱っていることを示唆しています。

媒体二次偏差を見つける方法

Excelのバリエーションの指標を計算するために、平均二次偏差を使用する必要があります。このパラメータをカウントする方法を調べることは非常に適切です。

代数の学年から、平均二次偏差が分散から抽出された平方根であること、すなわち、このインジケータはその平均値から全体的なサンプルの特定の指標の偏差の程度を決定することを知っています。 これにより、研究された兆候の振動の絶対的な尺度を測定し、それを明確に解釈することができます。

Excelの係数を計算します

残念ながら、Excelには標準式はありません。これにより、バリエーションインジケータを自動的に計算することができます。 しかし、これはあなたが心の中で計算をする必要があることを意味するのではありません。 「式の行の行」のテンプレートの欠如は、Excelの能力を損なうことができます。


Excelのバリエーションを計算するためには、数学の学習を思い出して、標準偏差を平均サンプル値に分割する必要があります。 つまり、式は次のとおりです。 - StandotClone(指定されたデータ範囲)/ SRは(指定されたデータ範囲)です。 この式を入力してください excelセルあなたが必要とする計算を取得したいです。

係数がパーセンテージとして表されるため、式を持つセルは適切なフォーマットを設定する必要があることを忘れないでください。 これは次のようにすることができます。

  1. ホームタブを開きます。
  2. カテゴリ「セル形式」を見つけて、目的のパラメータを選択します。

あるいは、クリックを使用してセルのパーセンテージを設定することもできます。 右ボタン 表の活性化された細胞上のマウス。 外観で コンテキストメニューただし、上記のアルゴリズムは、選択されたカテゴリ "セル形式"でなければならず、必要な値を設定する必要があります。


「パーセント」を選択し、必要に応じて10進記号の数を指定します

アルゴリズム上の誰かが難しいようです。 実際、係数の計算は2つの自然数を追加するのと同じくらい簡単です。 Exceleのこのタスクに従うことで、ノートブックの退屈なマルチステープルソリューションに戻ることはありません。

あなたはまだデータ散乱度の定性的比較をすることはできませんか? サンプルスケールで失っていますか? それでは、ケースを取り、上に設定された実際には理論的資料全体を習得してください。 予測の統計分析と開発にはもはやあなたが恐怖と否定的な原因となりました。 あなたの強さと時間を一緒に保存してください

この記事から、あなたは学ぶでしょう:

  • ;
  • 実行する方法 ExcelのXYZ分析;
  • アプリケーションXYZ Analysis 予測にデータを準備するとき。


Excelの変動係数の計算方法

これは、平均値(標準偏差の平均値の比)に対する値の散乱を反映した指標です。 変動係数はパーセンテージとして測定され、時系列の均一性を反映している。

バリエーション比率は、予測のためのデータの準備に役立つ優れたインジケータです。 バリエーション比率は、予測の計算に注意を払うべきランクを強調するのに役立つ指標であり、ランダムな要因からデータを清掃します。

係数が0%の場合、範囲は完全に均一である、すなわち すべての値は同じです。

変動係数が33%を超えると、古典的理論の数は不均一であると考えられている、すなわち 平均に対するデータの大きな変動。

例えば:

均質シリーズ

異種シリーズ

Excelの変動係数の計算方法

付随する変動\u003d平均に対する標準偏差率

エクセル係数 変種 次の式を使用して計算できます。

  • StandotClick(J6:M6) - 分析期間のExcelの標準偏差の値を計算するための式。
  • (SOMES(J6:M6)/スケジュール(J6:M6; "\u003e 0")) - 分析期間の平均。

数式をセルに紹介し、変動係数の計算を求めます


数式をデータ配列全体に拡張します。

XYZ分析をする方法

今度は私達は私達の変動係数をセグメント化し、それぞれ3rd文字x yとzのそれぞれを割り当てます

  • X - 変動比が0%から10%の行の場合
  • y - 変化率が10%から25%の行の場合
  • z - バリエーション比率が25%以上の行の場合

セルにExcelの式を入力します

if(N3。<=0,1;"X";ЕСЛИ(N3<=0,25;"Y";"Z"))


予測へのデータの準備中のアプリケーションXYZ解析

大きなデータ配列を操作する予測にデータを準備する際には、指標が必要です。これは、最初に注意を払うべき時系列がどの時系列に支払われるかを示唆しています。 インジケータとして、「変動が強化された」またはXYZ解析を使用することができます。

変動係数が10 - 25%を超える場合、またはYおよびZ行の場合、私たちはデータを勉強しています(たとえば、販売区域の状況で数ヶ月間販売)、偏差に影響を与える要因を決定します。

フィルタをXYZ列分析に追加し、ランクを分析します。

まず、25%以上のバリエーション比率で行をフィルタリングします。


私たちは、過去4-5ヶ月間に実際のデータの大きな偏差を持つランクを研究します。 失敗または突然の販売リフトの理由を判断してください。 予測のデータを準備します。 ランダムな要因の影響からデータを清掃するか、赤字を修正します。

また、一連の不均一性でも、時系列をグループ化することは理にかなっています。 例えば、

  • 四半期の売上前にロールする月までに不均質販売
  • 数ヶ月間売上高を転がす週の売上高
  • 商品による売上高は商業グループに崩壊しています...

同種のグループの上位レベルの予測を行い、その後、グループ内のロジックに比例を分散させます。

それから、変動比yを持つ行を強調表示します


同様に、各行を見てください。シリーズの非標準的な動作に気付いた場合は、原因と必要に応じてデータをクリーニングしてください。

要因のリストを作成することをお勧めします(たとえば、株式刺激株、在庫のある商品の不足、特別な顧客...)、および各要因について、予測のデータに差し引いた指標を決定します。

データが要因に清掃された後 将来的には繰り返されずに準備されないことは、販売予測を計算します。

命令

変動係数を見つけるために、次の式を使用してください。
v \u003dσ/ xs、ここで
σは平均二次偏差です。
XSRは平均算術変分級数です。

実際の変動係数は、変動の比較評価だけでなく、全体の均一性を特徴付けるためにも使用されることに留意されたい。 この指標が0.333、または33.3%を超えない場合、特徴の特徴付けは弱いと見なされ、0.333以上が強い場合。 強いばらつきの場合、研究された統計的集合体は不均一であると考えられ、平均値は異例であるため、この全体の一般化指標として使用することはできません。 変動係数の下限はゼロと見なされ、上限は存在しません。 しかしながら、特徴の変動の増加と共にその値が増加する。

バリエーション係数を計算するときは、平均二次偏差を使用する必要があります。 それは分散液から平方根として定義されています。これにより、次のように検索できます.D \u003dσ(X-XCS)^ 2 / n。 言い換えれば、分散は平均演算値からの偏差の平均二乗である。 平均二次偏差は、その平均値からの行の特定の指標が偏向されるかを決定します。 符号の伝送の絶対的な尺度であるため、明確に解釈されています。

バリエーション係数の計算例を考えてみましょう。 第1の技術によって生じる生産単位当たりの原材料の消費量は、第2の技術によって平均二次偏差σ1\u003d 4であり、σ2\u003d 3で平均二次偏差σ1\u003d 4である。平均二次偏差を比較するとき、それは最初の技術上の原材料の消費量の変動が2番目までより激しいという誤った結論を下すことが可能です。 変動係数v1 \u003d 0.4または40%、V2 \u003d 0.5または50%は、反対の出力を行うことができます。

相対的 インジケータ 測定値の変化の強さを特徴付けるように設計されています。 それらを見つけるためには、少なくとも2つの測定点で絶対値を知る必要があります - たとえば、タイムラインの2つのマークについて。 したがって、親戚 インジケータ それらは絶対的に二次的に考えられていますが、それにもかかわらず、それらなしでは、測定されたパラメータで発生する変化の全体像を推定することは困難です。

命令

相対的なインジケーターの値を取得するために、絶対値を別の絶対値に配信します。これにより、絶対区分の変更が特徴です。 数字(または「比較」)であり、分母では、現在の値を比較する絶対インジケータが必要です。それは "Base"または "比較の拠点"と呼ばれます。 。 分割の結果(つまり、相対的なインジケータ)は、現在の絶対表示がより基本的な絶対表示をより基本または基本の各ユニットに数回の単位の数回の数回を表します。

比較された絶対値と同じ測定単位(例えば、生成されたハブの数)がある場合、計算の結果として得られた相対的なインジケータは通常、パーセンテージ、PPM、分布、または係数として表される。 係数では、基本絶対表示が等しい単位を取り込む場合に相対インジケータが表現されます。 ユニットが100に置き換えられた場合、百万がプロミルがある場合は、相対的な指標はパーセンテージとして表され、1000万がプルネスミル中にある場合。 2つの量を比較すると、異なる測定単位(例えば、国のMusitaおよび人口)を持つ場合、得られた相対的な指標は名前付き量(例えば、一人当たりのGaubice)で表される。

現象またはプロセスを分析するときに統計がよく、研究中の指標の平均レベルに関する情報だけでなく、も考慮に入れる必要があります。 個々の単位の値の散乱または変動 これは一般的な集合体の重要な特徴です。

ほとんどのバリエーションは、株式、需要、および需要、さまざまな期間で、異なる場所での金利の対象となります。

バリエーションを特徴付ける主な指標 範囲、分散、平均二次偏差、変動係数です。

バリエーションバリエーション 最大と最小の特性値の違いです。 r \u003d xmax - xmin.。 この指標の不利な点は、符号の特性評価の境界のみを評価し、これらの境界内のそのボラティリティを反映していないことです。

分散 この不足を奪われた。 それは彼らの平均サイズからの標識の兆候の平均二乗として計算されます。

簡略化された分散計算方法 以下の式(シンプルで加重)を使用して行われます。

これらの式の例は、問題1および2に示されている。

実際にはインジケータのISを広げる 平均二次偏差 :

平均二次偏差は分散液から平方根として定義され、研究された符号と同じ寸法を有する。

考慮された指標は、変動の絶対値を得ることを可能にする、すなわち 研究された特徴の測定単位でそれを推定した。 彼らとは異なります バリエーション係数 相対的な用語での割り当て可能性を測定することが多いと、多くの場合好ましい。

変動係数を計算するための式。

トピックの「統計の変動指標」の作業の解決例

タスク1。 。 地区の銀行の平均貢献の規模に及ぼす広告の影響を研究するとき、2つの銀行が調べられました。 以下の結果が得られます。


1)各銀行について:a)月の平均預金サイズ。 b)沈殿物の分散
2)2つの銀行の月の平均預金サイズ。
3)広告に応じて、2つの銀行への寄与の分散。
4)広告を除いて、すべての要因に応じて、2つの銀行への拠出金の分散。
5)追加規則を用いた全体的な分散。
6)決定係数
7)相関関係

決定

1) 広告のある銀行のためのデザインテーブルを作ろう 。 月の平均預金サイズを決定するために、間隔の真っ只中にあります。 この場合、開放間隔の大きさ(第1)は、従来、それに隣接する間隔のサイズと等しくなる(第2)。

平均堆積サイズは、中間算術重み付けの式によって求められます。

29 000/50 \u003d 580 RUB。

分散デポジット私たちは式によって見つけます:

23 400/50 = 468

生産された同様の行動 広告なしの銀行のために :

2)2つの銀行の平均預金サイズを一緒に見つけます。 XSR \u003d(580×50 + 542.8×50)/ 100 \u003d 561.4ルーブル。

3)広告に応じて、2つのバンクの寄与の分散は、式:σ2\u003d PQ(代替の文字分散式)で見つけます。 ここでP \u003d 0.5 - 広告要因の割合。 Q \u003d 1~0.5、次にσ2\u003d 0.5 * 0.5 \u003d 0.25。

4)残りの要因の割合は0.5であるため、広告以外のすべての要因に応じて、2つのバンクへの寄与の分散が0.25です。

5)追加規則を使用して全体的な分散を定義します。

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ2\u003dΣ2ファクト+Σ2オシロート\u003d 552.08 + 345.96 \u003d 898.04

6)判定係数η2\u003dσ2ファクト/σ2\u003d 345.96 / 898.04 \u003d 0.39 \u003d 39% - 39%堆積物の量は広告に依存する。

7)経験的相関比η\u003d√η2\u003d√0.39\u003d 0.62 - 接続はかなり近いです。

タスク2 。 商用製品の大きさによって企業のグループ化があります。

決定する:1)商用製品の値の分散 2)二次二次偏差。 3)バリエーションに装着されています。

決定

1)条件下では、配信の間隔回数を示します。 それは離散的に表現されなければならない、つまり間隔の中央(x ")を見つける必要があります。閉じた間隔のグループでは、単純な中間演算の中央を見つけます。上限のグループでは、このアッパーの違いとして間隔の境界と半分(200-(400 -200):2 \u003d 100)。

下限境界を持つグループ - 前回の間隔のこの下限と半数の合計(800+(800~600):2 \u003d 900)。

市販品の平均値の計算は、式によって行われる。

XSR \u003d K×((σ(((x "-a):k)×f):σf)+ a。ここでa \u003d 500 - 最高周波数のバリアントのサイズk \u003d 600-400 \u003d 200 - 最高周波数の間隔のサイズ。テーブル内の結果位置:

したがって、研究された期間全体の市販品の平均量は、XSR \u003d(-5:37)×200 + 500 \u003d 472.97000ルーブルと等しい。

2)分散次式を検索します。

σ2\u003d(33/37)* 2002-(472.97-500)2 \u003d 35 675,67-730,62 \u003d 34 945.05

3)平均二次偏差:σ\u003d±σ2\u003d±√34945.05±186.94千ルーブル。

4)変動係数:V \u003d(σ/ xs)* 100 \u003d(186.94 / 472.97)* 100 \u003d 39.52%

変動のすべての指標のうち、RMS偏差は他の種類の統計分析を実行するために最も使用されます。 しかしながら、標準偏差は値の測定の絶対的な評価を与え、それが値それ自体を基準にするかを理解するために、相対的なインジケータが必要とされる。 このインジケータは彼と呼ばれます バリエーション係数.

バリエーション係数の式:

この指標は、パーセンテージとして測定されます(100%を乗算する場合)。

統計では、バリエーション係数がある場合

10%未満、データ分散度はマイナーと見なされます。

10%から20%〜中から

20%以上、33%以下

変動係数の値は33%を超えない、組み合わせは均質と見なされます。

33%を超える場合は、不均質です。

均質集合体について計算された平均は重要である。 不均一な骨材では、凝集体の標識の著しい散乱による骨材を特徴付けることはできません。

平均線形偏差の計算で例を取ります。

そしてリマインダーのスケジュール


これらのデータによると、平均値、変動変動、平均線形偏差、分散および標準偏差を計算します。

平均値は通常の平均算術演算です。

バリエーションバリエーションは、最大値と最小値の差です。

平均線形偏差は式であると考えられます。

分散液は式:

ラジアル偏差 - 分散からの平方根:

計算符号を減らす。

インジケータの変動は、プロセスまたは現象の変動性を反映しています。 その程度はいくつかの指標を使用して測定できます。

    バリエーションバリエーション - 最大値と最小値の違い。 可能な値の範囲を反映しています。

    中線形偏差 - 分析された総計のすべての値の平均値の平均値の平均値を反映しています。

    分散 - 中央の偏差。

    ラジアル偏差 - 分散の根本(ミッドスクエア偏差)。

    バリエーション係数 - スケールや測定単位に関係なく、値の散乱度を反映して、最も多用途のインジケータ。 変動係数はパーセンテージとして測定され、さまざまなプロセスと現象の変動を比較するために使用できます。

したがって、統計的分析において、現象の均一性およびプロセスの安定性を反映した指標のシステムがある。 多くの場合、変動の指標は独立した意味を持ち、データをさらに分析するために使用されます。 例外は、データの均一性を特徴付ける変動係数です。これは貴重な統計的特性です。

トピックを続ける:
通信網

はじめに次のアップグレードの時間が起きたときに、私はほとんどすべてのコンポーネントを新たに取得しました。 そして古い、親切、良い、...