これらのモデルの統計的有意性ログとモデルの破損 複数回帰モデルとそのパラメータの重要性を確認してください

パラメータと構築の計算 回帰モデル

相関分析

彼の目標は判断することです 通信文字(ストレート、リバース) 通信力 (接続はありません。接続は弱い、中程度、目立つ、強い、非常に強い、完全な接続です)。 相関分析は、不可欠な要素を選択するために使用される、そして回帰式のパラメータを計算するために使用される、そして通信の重大度(相関係数)の性質(相関係数)に関する情報を作成する。 1つの要因で、相関係数が計算され、いくつかの要因が存在する場合には、2種類の結合が見つかります。(1)依存変数と独立した(2)リンクとの接続。

マトリックスの考慮は、まず、 要因を特定します 本当に研究中の従属変数に影響を与え、それらを降順に構築(ランク)する。 第二に、 要素数を最小限に抑えます モデルでは、他の要因と強くまたは機能的に接続されている要因の一部を排除します(私たちはそれ自体独立した変数のリンクについて話しています)。

1因子モデルと2因子モデルが実際に最も信頼できることが知られています。

2つの要因が自分自身の間に強いまたは完全な接続を持っていることが発見された場合 回帰方程式 それらのうちの1つを含めるのに十分なでしょう。

ここで最も見つけようとしています 正確な測定 独立した値X 1の値が知られている場合、依存値の依存値の値を予測するために、通信を明らかにした。 x 2、.... X. n

この尺度は、線形重回帰依存の数学的モデルによって表される一般化されています。

Y \u003d A 0 + B 1 x 1 + B 2 x 2 + ... + b n x n

EUMはモデルのパラメータを計算します:フリーディック 0. (定数、または交差点)と係数 b P. (不況係数)。 大小 w 応答を呼び出します x 1、x 2、。., ×P - 要因または予測因子

方程式の各バージョンを受け取った後、必須の手順はその評価です。 統計的有意性主な目標は最高の重要度の式を得ることです。 しかしながら、計算がコンピュータを実行するという事実、そして式の評価に基づく決定は、研究者(式を採用または廃棄する)によって行われる(式を採用または廃棄する)、このマンの第3段階を区別することが可能である。インテリジェントな非成形ステージとしての機械技術 ほとんど全て 方程式の重要性の評価に関するデータはコンピュータを準備します。

統計的有意性 応答値を予測するために使用するための仮定モデルの適合性。 得られたモデルの品質を評価するために、プログラムは研究者を考慮しなければならず、それらを周知の統計的基準と比較し、常識の観点からモデルを評価する数の係数を計算した。



この段階では、回帰の意義と判断係数とF基準が極めて重要な役割を果たしています。

四角形 (R 2) - 決定係数 - これは観測値の間の多重相関係数の二乗です。 y。 特定の要因を持つモデルに基づいて計算された理論値。 判定係数はモデルの妥当性を測定する。 0から1までの値を取ることができますこの値は、シリーズを比較するのに特に役立ちます。 異なるモデル そして最高のモデルを選ぶ。

R 2は、モデルに含まれる要因により説明された、yの観測値に対するyの予測値(理論値)値の変動の割合の割合である。 非常に良いIF r 2\u003e \u003d 80%。 理論値の残りの部分は、要因モデルに参加しなかった他の人によって異なります。 研究者の仕事は増加する要因を見つけることです r 2、 完全な方程式を得るための予測バリエーションの説明を与えます。 しかし、係数 R 2。 要因のすべての値が異なる場合、1(または100%)以上が到達する可能性があります。 そして、データに繰り返し実験がある場合は、値 R 2。 モデルがどれほど良くなっていても、1に到達できません。 したがって、回帰の登録の前に、データの重複をソース表から削除する必要があります。 一部のソフトウェアパッケージは自動的に重複を削除し、一意のデータのみを残します。 同じデータの繰り返しは、モデル推定値の信頼性を低下させる。 r 2 \u003d 1 実験(観察された)および理論的な(計算された)データの完全な同意、すなわち理論値が観察されたものと正確に一致する場合のみ。 しかし、これはまったくありそうもないと考えられています。

回帰分析の手段、含める。 Excel 全体としての方程式の回帰の重要性のためのF基準 これは観察されたデータに従って計算されます FP(F。 計算された、観察された)は、対応するFCの臨界値と比較されるべきである。 (F. クリティカル、表形式)(付録Aを参照)。 FC研究者は、指定された確率レベルで公開されている統計表から選択します(モデルのパラメータが計算されたもの、たとえば95%)。

観察値があれば fp。 FCの臨界値が小さいほど、式は重要と見なすことはできません。 他の用語では、それは、一時的なモデルにおける全ての回帰係数の重要性に対する非ゼロ仮説、すなわち係数は実質的にゼロに等しい。

計算されたデータが完全に解釈されていない場合、相関および回帰分析の電子技術は絶対に役に立ちます。

結果として得られるモデルが統計的に有意である場合、それは(予測)、制御または説明を予測するために使用される。

わずかな場合は、他のコミュニケーションが検索する必要があるという他の形態の通信が当てはまると仮定して、モデルは拒否されます。

07/25/16 Irina Aninica.

33095 0

この記事では、モデルが高品質であるかどうかを理解する方法について説明します。 結局のところ、それは私たちに質の高い予測を与えるための高品質のモデルです。

Prognozプラットフォームには、建築と分析のためのモデルの広範なリストがあります。 各モデルには独自の詳細があり、さまざまな前提条件に適用されます。

「モデル」オブジェクトを使用すると、次の回帰モデルを構築できます。

  • 線形回帰(最小二乗法によって推定)。
  • 線形回帰(機器変数の方法による評価)。
  • バイナリ選択モデル(最大の真理による評価)。
  • 非線形回帰(最小二乗法による非線形法によって推定)。

モデルから始めましょう 線形回帰。 当該の大部分は他の種に分配されます。

線形回帰モデル(MNA評価)

どこ y。 - 説明可能な数字、 バツ。 1 , …, xのK。- ランクの説明 e. - モデルエラーベクトル、 b 0 , b 1 , …, b - モデル係数

だからどこで見るべきですか?

モデル係数

「識別式」パネルの各係数について、数の統計情報が計算されます。 標準誤差、t-統計, 係数の意義の可能性。 後者は最も普遍的であり、それに対応する要因のモデルからの確率がどのように除去されるかを示しています。 この係数、それは重要ではありません。

私たちはパネルを開き、最後の列を見て、それはまさに係数の重要性についてすぐに私たちに伝えられるものです。

モデル内で重要性が高い可能性が高い要因はそうではありません。

ご覧のとおり、最終係数を除くことで、モデル係数は実際には変更していません。

考えられる問題:理論的モデルによると、理論的モデルによると、重要性が高い可能性がある要因はありますか。 係数の重要性を判断するための他の方法があります。 たとえば、相関マトリックスの要因を見てください。

相関行列

「要因の相関」パネルには含まれています 相関行列 すべての変数間で、選択した値のペアのクラウド観測値を構築します。

相関係数 電力を表示します 線形依存 2つの変数の間に。 -1から1に変わります。-1の近傍は、負の線形依存性を示し、1に近接しております。

観測値のクラウドでは、1つの変数の依存関係がもう一方の変数と似ているかどうかを視覚的に決定できます。

要因の間に強く相関している場合は、そのうちの1つを除外してください。 あなたが望むならば、通常の線形回帰のモデルの代わりに、相関のために除外された要因を含む、機器の変数を含むモデルを構築することができます。

相関行列はモデルには意味がありません 非線形回帰それは電力のみを示しているからです 線形 依存関係

品質基準

各モデル係数をチェックすることに加えて、それが一般的にどれほど良いかを知ることが重要です。 このために、「統計統計」パネルにある統計が計算されます。

決定係数(r 2 ) - モデルの品質を評価するための最も一般的な統計。 r 2 次の式で計算されます。

どこ n - 観測数。 y i. - 説明変数の値。 - 説明変数の平均値。 私。 - 推定パラメータに従って構築されたモデル値。

r 2 0から1までの値を取り、説明可能なシリーズの説明的分散の割合を示します。 近い r 2 1に、モデルが良くなるほど、原因不明の割合が少なくなります。

考えられる問題:使用の問題 r 2 それは、その値が方程式に係数を追加することによって低減されないことです。 観察としてモデルに非常に多くの要因を追加した場合、1に等しくなることが保証されます。 したがって、モデルを使って異なる数の要因を比較する r 2 意味を成さない。

使用されたモデルのより適切な評価のために 決定係数補正係数(adj。 r 2 ) 。 名前から分かるように、この標識は修正されたバージョンです。 r 2 、追加された各要因に対して「罰金」を重ね合わせる:

どこ k - モデルに含まれる要因の数。

係数 adj。 r 2 0から1までの値もありますが、値よりも大きくなることはありません。 r 2 .

アナログ t- 係数統計IS フィッシャー統計(f -統計)。 しかし、IF t- スタティズムは1つの係数の重要性の仮説をチェックする f-stationは、すべての要因(定数を除く)が重要ではないという仮説をチェックします。 値 f- 統計は重要でも比較されており、それに対しては重要ではない可能性もあります。 このテストはすべての要因が仮説をチェックすることを理解されたいと思うべきです。 同時に わずかです。 したがって、わずかな要因の存在下では、全体としてのモデルは意味があるかもしれません。

考えられる問題:ほとんどの統計は、モデルが定数を含む場合に構築されています。 しかし、Prognozプラットフォームでは、評価された係数のリストから定数を削除する機会があります。 そのような操作がいくつかの特性が許容できない値をとることができるという事実をもたらすことを理解する価値があります。 そう、 r 2 そして adj。 r 2 一定の不在下では負の値をとることができます。 この場合、それらは0から1の値をとる部分として解釈することはできません。

Prognozプラットフォームで定数を持たないモデルの場合 非センタリング係数の検出(r 2 そして adj。 r 2 )。 修正式は、モデル内でも0から1の範囲までの値を一定に導きます。

上記のモデルの記載された基準の値を見てみましょう。

見ているように、判定係数はかなり大きいが、依然として原因不明の分散が依然としてかなりの割合がある。 フィッシャー統計は、私たちが選んだ要素の組み合わせが重要であることを示唆しています。

比較基準

基準に加えて、モデルの品質について話すことを可能にして、モデルを互いに比較できるようにする特性はいくつかあります(同じ行を同じ行を説明する場合)。

ほとんどの回帰モデルは最小化タスクに縮小されています。 残留四角形の量(和。 の。 二乗した。 残差 , SSR ) 。 したがって、このインジケータに従ってモデルを比較すると、どのモデルが得られたシリーズを説明したかを決定することが可能である。 そのようなモデルは、残基の正方形の合計の最小値に対応するであろう。

考えられる問題:それは要因の数の増加で、この指標は同じようにそれを注目する価値があります。 r 2 境界値(SSR、明らかに、境界値0)を絞ります。

いくつかのモデルは最大化に減少します。 最大真理関数の対数log log ) 。 線形回帰モデルの場合、これらのタスクは同じ解決策につながります。 based log log 情報基準は、回帰モデルとスムージングモデルの両方を選択するという問題を解決するためによく使用されます。

  • 情報基準Akaika(アカイケ。 情報 基準。, AIC。)
  • シュワルツ基準(シュワルツ。 基準。, sc)
  • 基準ハナナQuina(ハナン。- quinn。 基準。, HQ。)

すべての基準は、観測数とモデルパラメータの数を考慮に入れ、互いにパラメータ数の「微関数」の種類とは異なります。 情報基準の場合、ルールがあります。 最高のモデル 基準の最小値があります。

私たちのモデルをその最初のオプションと比較してください(「過剰な」係数を使用して)。

どのようにあなたは見ることができます このモデル 残基の二乗四角をもたらしたが、情報基準よりも悪化し、補正された決定係数に関する。

残留物の分析

モデルの残りが互いに相関しない場合、モデルは高品質と見なされます。 それ以外の場合は、要因のモデルでは考慮されていない説明変数に一定の一方向の影響があります。 これはモデルの推定値の質に影響を与え、それらを無効にします。

最初の順序の自己相関(現在の値からの現在の値の依存性)の統計を確認するために使用されます。 ダービーナ・ワトソン(dw。 ) 。 その値は0から4までの間隔です。自己相関がない場合 dw。 0に近接して0に近接しております。

それが判明したように、私たちのモデルの残留物の自己相関があります。 自己相関から、「差」変換の変換を説明可能な可変またはARIMAモデルまたはARMAXモデルモデルの使用を取り除くことができます。

考えられる問題:Darbina-Watsonの統計は、定数なしのモデル、ならびに説明可能な変数の大きさの値を要因として使用するモデルには適用されません。 このような場合、統計は提示されたときに自己相関がないことを示すことができます。

線形回帰モデル(機器変数の方法)

インストゥルメンタル変数を持つ線形回帰モデルには次の形式があります。

どこ y。 - 説明可能な数字、 バツ。 1 , …, xのK。 - ランクの説明 バツ。1 、 …、バツ。̃ k - 機器変数を使用してシミュレートされた説明行、 z 1 , …, z L. - 機器変数、 e., j - ベクトルエラーモデル、 b 0 , b 1 , …, b - モデル係数 c. 0 j, c. 1 j, …, c lj。 - 説明行のモデル係数

モデルの品質を調べるべき方式は似ていますが、品質基準のみが追加されています j -統計 - アナログ f- 統計的変数を考慮に入れる。

モデルバイナリ選択

バイナリ選択モデルの説明変数は、2つの値が0または1の値である値です。

どこ y。 - 説明可能な数字、 バツ。 1 , …, xのK。 - ランクの説明 e. - モデルエラーベクトル、 b 0 , b 1 , …, b - モデル係数 f - 0から1の値を返す非減少機能。

モデル係数は、最尤関数の値を最大化する方法によって計算されます。 このモデルでは、そのような品質基準は次のように関連します。

  • 判定係数MCFADDEN(マクファドデン。 r 2 ) - 普通のアナログ r 2 ;
  • l-統計 そしてその確率はアナログです f- 統計;
  • 比較基準: log log , AIC。, sc, HQ。

非線形回帰

モデルの線形回帰の下で、私たちは形式のモデルを理解します。

どこ y。 - 説明可能な数字、 バツ。 1 , …, xのK。 - ランクの説明 e. - モデルエラーベクトル、 b - ベクトルモデル係数

モデル係数は、残留四角の値を最小にする方法によって計算されます。 このモデルでは、相関行列をチェックする以外は、同じ基準が線形回帰の場合と同じようになります。 また、F統計が重要なモデルが一般的にモデルと比較されているかどうかを確認することにも注意します。 y。 = b 0 + e.関数のソースモデルにあっても f (バツ。 1 , …, xのK。, b)定数に対応する基礎はありません。

結果

テーブルの形式で検証済みの特性のリストを要約して想像しましょう。

この記事が読者に役立つことを願っています! 次回は他のモデル、すなわちArima、Armaxについて話します。

尤度比(Test Wald)の援助を伴うモデルの重要性を確認する、主な仮説の指名から始まります。

この仮説を検証するために、選択的統計が計算されます

ここでは、尤度関数の対数の最大値の値と、主仮説を正当化した場合の尤度関数の対数のLNL0値との値。

主な仮説が当てはまる場合、選択的統計(4.7.1)は法律2 C(M-1)自由度によって配布されます。 有意性(1 - B)および(M - 1)自由度に関して、右側の重要な臨界領域K2の境界がクリティカルポイントキレッドスクエアのテーブルを検索する。 不等式が実行された場合

それから主な仮説は拒否されています、彼らは代替的な仮説を受けて言う、 モデルが統計的に重要であること。さもなければ、彼らはモデルの重要性ではなく、その改訂に切り替えることについて仮説をかけます。

バイナリ選択モデルの場合、ファクタの重要性は、型仮説の各因子I \u003d 1、...、(M-1)についてテストによってチェックされます。

これらの仮説をテストするために使用される選択的統計は、漸近的に正規分布を持ち、z統計と呼ばれます。 二国間クリティカルエリアの境界は、特定の有意レベル(1-B)でラプラステーブルを探しています。

不等式が実行された場合

1に。

それは係数Iのゼロからわずかな差についての基本的な仮説を必要とし、それに対応する要因がモデルにとって重要ではないと結論づける。

バイナリ選択モデルの場合、判定係数の概念は定義されていません。 しかしながら、それらは、もはや説明モデルを特徴付けることができないいわゆる擬似決定係数を定義する。

定義4.7.1。 疑似 - 決定係数を次の値と呼びます。

定義4.7.2。 MCFADDEN(MCFADDEN)の信頼性インデックスを特徴と呼びます。

バイナリ選択モデルのパラメータがゼロとわずかに異なる場合、両方の挿入係数はゼロであることを強調する必要があります。

講義では、非線形回帰モデル、特にバイナリ依存変数のモデルを検討しました。 これらのモデルを2回の回帰関数について調べた:Logit(Rogistic Function)とBreaks(標準正規分布法の分布関数の関数を使用)。 このような回帰関数のパラメータの推定は、最尤法を用いて得られる。 モデルは、Chi二乗分布を有する統計に基づくWALDテストを使用してテストされます。 マルチファイク回帰モデルを研究するときは、yに独立した変数の影響の制限効果として、BJのパラメータの推定値を解釈しました。 バイナリ選択モデルに戻りましょう。 P(Y \u003d 1 | X)の派生物を見つけようとすると、次の式になります。

ここで、z \u003d 0 + 1×1 + ... M-1xm-1。

微分複素関数の定理と、密度特性(分布関数から導出された(分布関数f(z))から、次のようにします。

あるいは、パラメータ推定値の2番目の指定を使用します。

P(y \u003d 1 | x)\u003d atjf(z)

前のように、未知のパラメータの推定値はBを介して示されます。

それから、我々は次のように主張することができます:分布密度は常に負でないので、派生物の符号

それはパラメータ推定の兆候にのみ異なりますが、すべての独立変数の関数になります。 さらに、パラメータ推定値が正の場合、変数XJの増加は確率の増加につながる。

そして、パラメータ推定値がそれぞれ負の場合、それぞれ指定された確率を減らす。

コメント。 係数Xが2値変数である場合は、限界効果の概念を導入することは不可能です。

各変数X(定量的!!!)について、いわゆる平均リミット効果が導入されました。 これを行うには、定量的変数の選択的平均とバイナリの場合は "1"のパーセンテージを計算し、それらを変数の代わりに分布密度の式に置き換えます。

議論に関するもう1つの質問:パラメータの推定後、モデルのロジット(ブレイク)はUの値を予測しますか? 例えば以下のようにして。 パラメータ推定値と値xjの値xjの値を置き換え、変数の値を計算しました。 z\u003e 0の場合、y \u003d 1、zの場合<0, то считают, что У=0. Замечание. Мы рассмотрели ситуацию, когда переменная у была измерена в номинальной шкале, но принимала всего два значения: 0 и 1. В общем случае, когда у может принимать несколько значений, например 0, 1, 2, 3, используют множественный (по у!!) логит или пробит. Кроме того, у может быть измерен в порядковой шкале, тогда в Стате используют порядковый логит (пробит) ologit (oprobit).

コメント。 頻繁に研究が切り捨てられたサンプルに関する研究を行わなければならない。 たとえば、世帯収入が勉強している場合は、非常に大きな収入を持つ回答者(たとえば100万ルーブル以上)を調査から除外する必要があります。

そのような場合は、つま先モデルによって使用されます。

f(0 + 1×1 + ... M-1xm-1)

f(0 + 1×1 + ... M-1xm-1)

f(0 + 1×1 + ... M-1xm-1)

F(0 + 1×1 + ... M-1XM-1) - (F(0 + 1×1 + ... M-1XM-1))2

タスク。 地域の領土によると、1990年代のデータが与えられます。
地域の部屋 1日の1日あたりの最低級の中間体、 h 母親の給料、摩擦、 w
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173
必要:
1. Xからの一対の回帰の線形方程式を構築する。
2.蒸気相関の線形係数と近似の平均誤差を計算します。
回帰および相関パラメータの統計的有意性を評価します。
4.一人当たりの平均値の平均値の予測値で賃金予測を行い、平均レベルの107%を占めています。
5.予測の精度を評価し、予測の誤差とその信頼区間を計算しました。

決定 電卓を使って見つけます。
グラフィックメソッドを使用して .
この方法は、検討された経済指標間の通信形態の視覚的画像に使用される。 これを行うために、長方形の座標系では、グラフが構築され、結果として生じる動物の個々の値は縦軸に沿って堆積され、横軸に従ってxの要因の個々の値が堆積される。 。
生産的な標識と要因の兆候の点の組み合わせが呼ばれます 相関の分野.
相関フィールドに基づいて、すべての可能な値xとyの関係が線形であることを仮説化することができます(一般的な集計に対して)。
線形回帰式は、y \u003d bx + a +εの形式を有する。
ここで、εはランダムな誤差(偏差、憤り)である。
ランダムエラーの存在の原因:
1.かなり説明変数の回帰モデルに含まれています。
変数の集約。 例えば、総消費量の関数は、支出について個々の個人の一連の解決策を一般的に表現する試みである。 異なるパラメータを有する個々の関係の近似だけである。
モデル構造の誤った説明。
4.機能仕様が正しくありません。
測定エラー。
各特定の観測値の偏差εiは、I - ランダムでそれらの値はサンプル内で不明である。
1)X iとy iの観察によれば、パラメータαとβの推定値のみを得ることが可能である。
2)パラメータαおよびβ回帰モデルの推定値はそれぞれ、ランダムな文字であるAおよびBの値である。 ランダムサンプルに対応します。
次に、推定された回帰式(選択的データに従って構築されている)は、y \u003d bx + a +εの形式であり、ここで、E iはそれぞれ誤差εi、aおよびbの観測値(推定値)である。見つかったパラメータαおよびβ回帰モデル。
パラメータαおよびβを推定するために、MNAが使用される(最小二乗法)。
正規方程式のシステム
私たちのデータのために、式のシステムは形をしています
最初の方程式から、Aを表現し、2番目の方程式に代わる
B \u003d 0.92、A \u003d 76.98に入ります
回帰方程式:
y \u003d 0.92 x + 76.98

回帰方程式のパラメータ
選択的平均



選択的分散:


ラジアル偏差


相関係数
接続の厳しさの指標を計算します。 この指標は、式:によって計算される選択的線形相関係数である。

線形相関係数は、-1から+ 1までの値をとる。
特徴間の通信は弱く強い(近い)。 それらの基準はサンプラースケールで推定されます。
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
この例では、平均毎日の給与と平均的な自給自足の最小値との関係は、高く、まっすぐです。
1.2。 回帰方程式 (回帰式の評価)

線形回帰式は、y \u003d 0.92 x + 76.98の形式を有する
線形回帰方程式の係数は経済的意味を与えることができます。
係数b \u003d 0.92は、測定単位毎の係数xの値の増減を伴う、有効インジケータの平均変化(測定単位y)を示す。 この例では、1摩擦の増加を伴います。 日中の平均毎日の自給自足最小値は、平均値が0.92増加します。
係数A \u003d 76.98は正式に平均毎日の賃金の予測されたレベルを示していますが、x \u003d 0が選択値で近づく場合に限ります。
Xの対応する値を回帰式に置き換えると、観察ごとに有効なインジケータy(x)の整列(予測)値を定義できます。
1日あたりの平均毎日の給与と平均化された最小値との関係は、回帰係数Bの符号を決定します(\u003e 0が直接接続、そうでなければ - リバース)。 この例では、接続はまっすぐです。
弾力係数。
回帰係数(実施例B)は、有効指標の測定単位とXの因子の測定単位に違いがある場合の生産的基準に対する要因の影響の直接評価のために使用することが望ましくない。
これらの目的のために、弾性係数とベータは計算される - 係数。 弾性係数は式:


それは、結果の平均値が1%×1%の結果であるかを示す。 要因の広い範囲の程度を考慮に入れていません。
その結果、1日あたりの平均平均自己由来の最低値を1%変えると、1日以内に1%未満の平均値の平均の平均値を変更すると、1%未満が変わります。 言い換えれば、平均的な永久的な小さなXの平均永久的な小さなXの影響は、必須ではありません。
ベータ - 係数 それは、その平均二次偏差の値が、残りの独立変数の一定値でその標準偏差の値によって標準偏差の値によって標準偏差の値によって変更されたときに、その平均二次偏差の値が平均で変化するかを示しています。 :

それら。 この指標のRMS偏差の値によるXの増加は、このインジケータのRMS偏差の0.721×平均平均賃金Yの増加につながる。
1.4。 近似誤差
絶対近似誤差を使用して回帰式の品質を推定します。


誤差は15%未満であるため、この式は回帰として使用できます。
決定係数
象限(複数)の相関係数は決定係数と呼ばれ、これは符号の要因の変動によって説明された生産的特徴の変動のシェアを示す。
ほとんどの場合、判定係数の解釈を与えるため、パーセンテージとして表されます。
R 2 \u003d 0.72 2 \u003d 0.5199
それら。 平均恒久的な自給率の変化の症例の51.99%で、平均毎日の給与額の変化につながります。 言い換えれば、回帰式の選択の精度は平均です。 毎日の平均給与額の残りの48.01%の変化は、モデル内で説明責任を負いません要因によって説明されています。

バツ。 y。 x 2 y 2。 x o y。 y(x) (y i -y cp)2 (y-y(x))2 (x i -x cp)2 | Y - Y X |:Y
78 133 6084 17689 10374 148,77 517,56 248,7 57,51 0,1186
82 148 6724 21904 12136 152,45 60,06 19,82 12,84 0,0301
87 134 7569 17956 11658 157,05 473,06 531,48 2,01 0,172
79 154 6241 23716 12166 149,69 3,06 18,57 43,34 0,028
89 162 7921 26244 14418 158,89 39,06 9,64 11,67 0,0192
106 195 11236 38025 20670 174,54 1540,56 418,52 416,84 0,1049
67 139 4489 19321 9313 138,65 280,56 0,1258 345,34 0,0026
88 158 7744 24964 13904 157,97 5,06 0,0007 5,84 0,0002
73 152 5329 23104 11096 144,17 14,06 61,34 158,34 0,0515
87 162 7569 26244 14094 157,05 39,06 24,46 2,01 0,0305
76 159 5776 25281 12084 146,93 10,56 145,7 91,84 0,0759
115 173 13225 29929 19895 182,83 297,56 96,55 865,34 0,0568
1027 1869 89907 294377 161808 1869 3280,25 1574,92 2012,92 0,6902

回帰方程式のパラメータの評価
2.1。 相関係数の重要性

重要度のレベルα\u003d 0.05と自由度の程度の学生テーブルによると、Tクレタが見つかります。
tクレタ\u003d(10; 0.05)\u003d 1.812
ここで、m \u003d 1は説明変数の数です。
T Navel\u003e T批評的であれば、結果として生じる相関係数の値は重要であると認識されます(平等ゼロ相関係数を承認するゼロ仮説は拒絶されます)。
T avel\u003e T Crete以降、私たちは相関係数の平等化0の仮説を偏向させます。 言い換えれば、相関係数は統計的に意味がある。
一対の線形回帰T 2 R \u003d T 2 Bでは、回帰係数の重要性に関する仮説をチェックし、相関関係は重要性の仮説の検査に相当する 線形方程式 回帰

2.3。 回帰係数の推定値を決定する精度の解析
摂動の分散の不可欠な推定値は値です。


S 2 Y \u003d 157.4922 - 不可解な分散(回帰線の周囲の従属変数の変数の測定)。

12.5496 - 標準推定誤差(標準回帰誤差)。
■ランダム変数Aの標準偏差a。


S B - ランダム値Bの標準偏差b。


2.4。 依存変数の信頼の間隔。
経済予測は、建設されたモデルに基づく経済的予防が、以前に既存の変数の関係が保持され、保護期間の間であると仮定しています。
有効機能の従属変数を予測するには、モデルに含まれるすべての要因の投影値を知る必要があります。
因子の予測値は、研究されている指標のモデルに代入され、受信点予測推定値が見積もります。
(A + BX P±ε)
どこ

可能な限り95%の可能な値yが無制限の多数の観測値とX P \u003d 94の境界を計算します。

(76.98 + 0.92 * 94±7.8288)
(155.67;171.33)
95%の確率で、無制限の多数の観測値を有するYの値が見出された間隔から外れないことを保証することができる。
2.5。 回帰線形方程式の係数に対する仮説を確認する。
1)T統計 学生の基準。
有意性α\u003d 0.05のレベルで、個々の回帰係数ゼロ(代替H 1を等しくない)の平等に仮説H 0をチェックする。
tクレタ\u003d(10; 0.05)\u003d 1.812


3.2906\u003e 1.812以降、回帰係数Bの統計的有意性が確認される(この係数の平等ゼロの仮説を除去する)。


3.1793\u003e 1.812以降、回帰係数aの統計的有意性が確認されている(この係数の平等ゼロの仮説を拒絶する)。
回帰方程式の係数の信頼の間隔
信頼性が95%の回帰係数の信頼区間を定義します。
(B - TクレタS B; B + TクレタS B)
(0.9204 - 1.812 0.2797; 0.9204 + 1.812 0.2797)
(0.4136;1.4273)

(A - T LANG \u003d SV\u003e A)
(76.9765 - 1.812 24.2116; 76.9765 + 1.812 24.2116)
(33.1051;120.8478)
95%の確率では、このパラメータの値が見つかった間隔にあると主張することができます。
2)F統計 フィッシャーの基準
回帰モデルの重要性の検証は、フィッシャーのF基準を使用して行われ、その計算値は研究された指標の元の一連の観測値の分散と残留シーケンス分散の信じられない推定値の比である。このモデル。
k1 \u003d(m)およびk2 \u003d(n - m - 1)の計算値が所与の有意レベルで表以上の場合、モデルは有意と考えられる。

ここで、mはモデル内の要因の数です。
ペア線形回帰の統計的有意性の評価は、以下のアルゴリズムに従って行われる。
ゼロ仮説は、一般的に統計的に重要であることを前述している。有意度αのレベルでH 0:R 2 \u003d 0。
2. F基準の実際の値をさらに定義します。


ここで、ペアリング回帰の場合はm \u003d 1です。
3.正方形の合計(より大きい分散)の自由度数が1、残差の自由度の数が1であることを考慮して、表の値を所定の有意なレベルでフィッシャー分布テーブルによって決定されます。線形回帰を伴う正方形の合計(分散液)はN - 2である。
4. F基準の実際の値が表形式ではない場合、ゼロ仮説を偏向する理由がないと言われます。
それ以外の場合、ゼロ仮説は、全体としての式の統計的有意性に関する代替仮説を採用することを可能性のある仮説を逸脱しています(1-α)。
自由度K1 \u003d 1およびK 2 \u003d 10、FKP \u003d 4.96の程度の基準の表値
F\u003e FKPの実際の値は、決定係数は統計的に有意である(回帰式の推定値は統計的に信頼性が高い)。

トピックを続ける:
通信網

はじめに次のアップグレードの時間が起きたときに、私はほとんどすべてのコンポーネントを新たに取得しました。 そして古い、親切、良い、...