Excelで回帰を解く例。心理学における数学的方法

回帰分析は、統計調査で最も要求の厳しい方法の1つです。これは、従属変数に対する独立変数の影響の程度を確立するために使用できます。機能的にマイクロソフトエクセルこのタイプの分析のためのツールがあります。それらが何であるか、そしてそれらをどのように使用するかを見てみましょう。

ただし、回帰分析を実行できる機能を使用するには、まず、分析パッケージをアクティブ化する必要があります。そうして初めて、この手順に必要なツールがExcelリボンに表示されます。

タブに移動すると "データ"、ツールボックスのテープ上 "分析"新しいボタンが表示されます- "データ解析".

回帰分析の種類

回帰にはいくつかのタイプがあります。

放物線;
べき法則;
対数;
指数関数;
指標;
双曲線;
線形回帰。

後者のタイプの実行について回帰分析 Excelでは、後で詳しく説明します。

Excelの線形回帰

以下に、例として、外の1日の平均気温と、対応する営業日の店舗購入者数を示す表を示します。回帰分析の助けを借りて、気温の形での気象条件が出口の出席にどのように影響するかを正確に調べましょう。

一般的な線形回帰方程式は次のようになります。Y= a0 + a1x1 +…+ akhk。この式では Y変数、つまり私たちが研究しようとしている要因の影響を意味します。私たちの場合、これは購入者の数です。意味バツ変数に影響を与えるさまざまな要因があります。パラメーター aは回帰係数です。つまり、これまたはその要因の重要性を決定するのは彼らです。索引 kこれらの同じ要因の総数を示します。

分析結果の分析

回帰分析の結果は、設定で指定された場所に表形式で表示されます。

主な指標の1つは 決定係数..。モデルの品質を示します。私たちの場合には与えられた係数 0.705または約70.5％に等しい。これは許容可能なレベルの品質です。 0.5未満の依存関係は悪いです。

もう1つの重要なインジケーターは、行の交点のセルにあります。 「Y交差点」と列 「オッズ」..。これは、Yの値を示します。この場合、これは購入者の数であり、他のすべての要素はゼロに等しくなります。この表では、この値は58.04です。

グラフの交点での値 「変数X1」と 「オッズ」は、YのXへの依存度を示しています。この場合は、店舗の顧客数の気温への依存度です。 1.31の比率は、かなり高い影響の指標と見なされます。

ご覧のとおり、 Microsoftプログラム Excelは、回帰分析テーブルを非常に簡単に作成できます。ただし、出力で取得したデータを使用して作業し、その本質を理解できるのは、訓練を受けた人だけです。

建物線形回帰、Excel分析パッケージ（回帰）を使用すると、そのパラメーターとその重要性の推定をはるかに高速に実行できます。一般的なケースで得られた結果の解釈を検討してください（ k説明変数）例3.6による。

テーブルの中 回帰統計値が与えられます：

多数 R -多重相関係数;

R- 平方-決定係数 R 2 ;

正規化 R - 平方-調整済み R 2自由度の数を修正。

標準エラー-回帰の標準誤差 S;

観察-観測数 n.

テーブルの中 ANOVA与えられます：

1.列 df -自由度の数、等しい

文字列用回帰 df = k;

文字列用残りdf = n – k – 1;

文字列用合計df = n– 1.

2.列 SS-に等しい偏差の二乗和

文字列用回帰 ;

文字列用残り ;

文字列用合計 .

3.列 MS式によって決定される分散 MS = SS/df:

文字列用回帰-階乗分散;

文字列用残り-残余分散。

4.列 F -計算値 F-式によって計算される基準

F = MS（回帰）/ MS（残り）。

5.列 意義 F -計算されたに対応する有意水準の値 F-統計学 .

意義 F= FDIST（ F-統計学、 df（回帰）、 df（残り））。

重要性がある場合 F < стандартного уровня значимости, то R 2は統計的に有意です。

	係数	標準エラー	t統計	P値	ボトム95％	トップ95％
Y	65,92	11,74	5,61	0,00080	38,16	93,68
バツ	0,107	0,014	7,32	0,00016	0,0728	0,142

この表は次のことを示しています。

1. オッズ-係数値 a, b.

2.標準エラー–回帰係数の標準誤差 S a, S b.

3. t-統計学-計算値 t -次の式で計算される基準：

t統計量=係数/標準誤差。

4.R-値（有意性 t) 計算されたものに対応する有意水準値ですか t-統計学。

R-値= TDIST(t-統計学、 df（残り））。

もしも R-意味< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5..。下位95％および上位95％-理論的な線形回帰方程式の係数の95％信頼区間の下限と上限。

残りの引き出し
観察	予測されるy	残りe
	72,70	-29,70
	82,91	-20,91
	94,53	-4,53
	105,72	5,27
	117,56	12,44
	129,70	19,29
	144,22	20,77
	166,49	24,50
	268,13	-27,13

テーブルの中 残りの引き出し示されている：

列に観察-観測数;

列に 予測 y -従属変数の計算値;

列に 残り物 e -従属変数の観測値と計算値の差。

例3.6。食費に関するデータ（従来の単位）があります yと一人当たりの収入バツ家族の9つのグループの場合：

バツ
y

Excel分析パッケージ（回帰）の結果を使用して、食料費の1人当たりの収入額への依存性を分析しましょう。

回帰分析の結果を次の形式で記述するのが通例です。

ここで、回帰係数の標準誤差は括弧内に示されています。

回帰係数 a = 65,92 およびb= 0.107。間の通信方向 yとバツ回帰係数の符号を決定します b= 0.107、つまり接続は直接的で前向きです。係数 b= 0.107は、1人当たりの収入が1conv増加することを示しています。単位食料費は0.107conv増加します。単位

結果のモデルの係数の有意性を推定しましょう。係数の重要性（ a、b）によってチェックされます t-テスト：

P値（ a) = 0,00080 < 0,01 < 0,05

P値（ b) = 0,00016 < 0,01 < 0,05,

したがって、係数（ a、b）は1％レベルで有意であり、5％レベルではさらに重要です。したがって、回帰係数は重要であり、モデルは元のデータに適しています。

回帰推定の結果は、取得された回帰係数の値だけでなく、それらのセットの一部（信頼区間）とも互換性があります。 95％の確率で、係数の信頼区間は（38.16-93.68） aおよび（0.0728-0.142） b。

モデルの品質は、決定係数によって評価されます R 2 .

マグニチュード R 2 = 0.884は、食料支出の変動（広がり）の88.4％が一人当たりの収入の要因によって説明できることを意味します。

意義 R 2はによってチェックされます F-テスト：有意性 F = 0,00016 < 0,01 < 0,05, следовательно, R 2は1％レベルで有意であり、5％レベルではさらに重要です。

ペア線形回帰の場合、相関係数は次のように定義できます。 ..。得られた相関係数の値は、食料支出と一人当たり所得の関係が非常に近いことを示しています。

有効属性yの変化は、因子属性xの変化によるものです。有効形質の全分散の回帰によって説明される分散の割合 決定係数R2を特徴付ける..。にとって線形関係決定係数は、相関係数の2乗に等しくなります。

R 2 = r xy 2、ここでrxyは相関係数です。

たとえば、R 2 = 0.83の値は、83％のケースで、xの変化がyの変化につながることを意味します。つまり、回帰方程式の近似精度が高いということです。

回帰方程式のフィッティングの品質を評価するために計算されます。許容可能なモデルの場合、決定係数は50％を超える必要があると想定されています。決定係数が80％を超えるモデルは、非常に優れていると見なすことができます。決定係数R2 = 1の値は、変数間の関数関係を意味します。

いつ 非線形回帰 決定係数は、この計算機を使用して計算されます。で重回帰、検出係数は重回帰サービスを介して見つけることができます
一般に、決定係数は次の式で求められます。または
分散追加ルール：
,
ここで、は偏差の2乗の合計です。
-回帰による偏差の2乗の合計（「説明」または「因子」）。
-偏差の二乗和の残差。

このオンライン計算機は計算します 決定係数そしてその重要性がチェックされます（ソリューション例）。

命令。ソースデータの量を示します。結果のソリューションはに保存されます Wordファイル..。また、Excelでソリューションを検証するためのテンプレートが自動的に生成されます。

線形回帰により、一連の順序対（x、y）に最もよく一致する直線を記述することができます。として知られている直線の方程式一次方程式、以下に示します：

ŷは、与えられたxの値に対するyの期待値です。

xは独立変数であり、

a-直線のy軸上のセグメント、

b-直線の傾き。

次の図は、この概念をグラフィカルに示しています。

上の写真は、方程式ŷ= 2 + 0.5xで表される線を示しています。 y軸上のセグメントは、線とy軸の交点です。この場合、a = 2です。線の傾きbは、線の長さに対する線の立ち上がりの比率であり、値は0.5です。正の勾配は、線が左から右に上がっていることを意味します。 b = 0の場合、線は水平です。これは、従属変数と独立変数の間に関係がないことを意味します。つまり、x値を変更してもy値には影響しません。

Ŷとyはよく混同されます。グラフは、この方程式に従って、6つの順序付けられた点のペアと線を示しています

この図は、順序対x = 2およびy = 4に対応する点を示しています。バツ= 2はŷです。これは、次の式で確認できます。

ŷ= 2 + 0.5x = 2 +0.5（2）= 3。

y値は実際のポイントであり、-値は、特定のx値に対して線形方程式を使用して期待されるy値です。

次のステップは、順序対のセットに最も近い線形方程式を決定することです。これについては、前の記事で説明しました。ここでは、によって方程式の形式を決定しました。

Excelを使用して線形回帰を定義する

Excelに組み込まれている回帰分析ツールを使用するには、アドインをアクティブ化する必要があります 分析パッケージ..。タブをクリックすると見つかります ファイル->オプション（2007+）、表示されるダイアログボックスで パラメーターExcelタブに移動 アドオン。フィールドで コントロール選ぶ アドオンExcelをクリックします 行け。表示されるウィンドウで、反対側にチェックマークを付けます 分析パッケージ、押す わかった。

タブ内 データグループで分析新しいボタンが表示されます データ解析。

アドインがどのように機能するかを示すために、男と女がバスルームでテーブルを共有するデータを使用してみましょう。バスタブの例のデータを白紙の状態の列AとBに入力します。

タブに移動 データ、グループで分析クリック データ解析。表示されるウィンドウで データ解析選ぶ回帰図のように、[OK]をクリックします。

ウィンドウで必要な回帰パラメータを設定します回帰、写真に示されているように：

クリック わかった。次の図は、得られた結果を示しています。

これらの結果は、の独自の計算で得られた結果と一致しています。

このソフトウェアユーティリティがその作業で使用される計量経済学などの分野を含む、さまざまな活動分野で役立つことで知られています。基本的に、実習と実験室の演習のすべてのアクションはExcelで実行されます。これにより、作業が大幅に容易になり、特定のアクションの詳細な説明が提供されます。したがって、分析ツールの1つである「回帰」を使用して、最小二乗法を使用した一連の観測値のグラフを選択します。プログラムのこのツールとは何か、そしてユーザーにとってのメリットは何かを考えてみましょう。以下は、回帰モデルを構築するための短いが理解しやすい説明でもあります。

主なタスクと回帰の種類

回帰は、与えられた変数間の関係であり、これにより、これらの変数の将来の動作の予測を決定することができます。変数は、人間の行動を含むさまざまな周期的現象です。このExcel分析は、1つ以上の変数の値が特定の従属変数に与える影響を分析するために使用されます。たとえば、店舗での売り上げは、品揃え、価格、店舗の場所など、いくつかの要因の影響を受けます。 Excelでの回帰のおかげで、既存の売上の結果に基づいてこれらの各要因の影響度を判断し、取得したデータを別の月または近くにある別の店舗の売上予測に適用できます。

回帰は通常、変数の2つのグループ間の関係と関係の強さを明らかにする単純な方程式として表されます。一方のグループは依存または内因性であり、もう一方のグループは独立または外因性です。相互に関連するインジケーターのグループが存在する場合、従属変数Yは推論の論理に基づいて決定され、残りは独立したX変数として機能します。

回帰モデルを構築する主なタスクは次のとおりです。