Excel(Excel)における決定係数 Microsoft Excelの判定係数の計算

統計モデルの場合、多くの場合、予測の正確さを判断する必要があります。 これは特別な計算の助けを借りて行われます マイクロソフトエクセル。そして判定係数を使用する。 それはR ^ 2として示されています。

統計モデルは、係数に応じて高品質レベルに分けることができます。 0.8から1までにモデルが含まれています 良品質、十分な品質モデルは0.5から0.8のレベルを持ち、 質の悪い 0から0.5の範囲があります。

FIRSON関数を用いた精度を決定する方法

線形関数 判定係数は、相関係数の二乗に等しくなる。 あなたはそれを使って計算することができます 特殊機能。 まず、データを含むテーブルを作成します。

その後、計算結果が表示され、機能の挿入ボタンをクリックする場所を選択する必要があります。

その後、特別なウィンドウが開きます。 カテゴリは「統計的」を選択してCVGIRSONを選択する必要があります。 この機能により、Pearson関数に関する相関係数をそれぞれ決定することができ、相関係数\u003d決定係数の二乗値。

アクションを確認したら、フィールドに「既知のX」値と「既知の値y」を設定する必要があるウィンドウが表示されます。 マウスを持つ「既知の値y」フィールドを押すと、操作ウィンドウが列yのデータを割り当てます。同様の操作が行われ、別のフィールドがテーブルHからデータを選択します。

これらの行動の結果として、以前に結果を表示するように選択されたセル内の決定係数の値。

関数が線形でない場合の決定係数決定

関数が非線形である場合、Excelツールキットでは「回帰」ツールを使用して係数を計算することもできます。 データ解析パッケージにあります。 しかし、まず、「ファイル」セクションと[オープンオプション]リストに移動してこのパッケージをアクティブにする必要があります。

その後、メニューの「アドイン」を選択する必要がある新しいウィンドウで、SuperStructuresを制御するための特別なフィールドで、「Excelアドイン」を選択してそれらに移動します。

Excelアドインに移行した後、新しいウィンドウが表示されます。 ユーザーの上部構造に利用可能になることがわかります。 「分析パッケージ」近くにダニを置き、その行動を確認します。

画面の右側の「データ解析」をクリックした後に、「データ」セクションにあります。

開いた後、リストは「回帰」を選択し、その行動を確認します。

その後、設定できる新しいウィンドウが表示されます。 入力データを使用すると、xとyの間隔の値を調整できます、他の引数の引数の対応するセルを強調表示するのに十分です。 信頼性レベルのフィールドでは、目的のインジケータを設定できます。 出力パラメータを使用すると、結果が表示される場所を指定できます。 たとえば、現在のシートの表示を選択してから、最初に「出力間隔」項目を選択し、結果が表示され、セル座標が対応するフィールドを表示するメインウィンドウ領域をクリックする必要があります。 最後に行動を確認してください。

結果が作業ウィンドウに表示されます。 判定係数を計算するので、結果からR係数が必要です。 値を見れば、最高品質に関連するものがあることがわかります。

傾向線の決定係数を決定する方法

対応する値でテーブルを作成して、スケジュールを作成します。 トレンドラインを費やすには、スケジュールをクリックする必要があります。つまり、行が構築されている領域です。 ツールバーの上から「レイアウト」セクションを選択し、「トレンドライン」を選択します。 その後コンテキストの後 この例 リストは「指数関数近似」を選択します。

トレンドラインは黒の曲線としてグラフに表示されます。

判定係数を示すためには、黒い曲線を押す必要があります 右クリック マウスと「トレンドラインフォーマット」リストで選択します。

その後、新しいウィンドウが表示されます。 その中では、チェックボックスをマークして目的のアクションを選択する必要があります(スクリーンショットに表示)。 これにより、係数がグラフに表示されます。 完了したら、ウィンドウを閉じます。

作業ウィンドウのTrend Line Formatウィンドウを閉じた後は、決定係数の値を見ることができます。

ユーザーが異なるトレンドラインタイプを必要とする場合は、[トレンドラインフォーマット]ウィンドウで選択できます。 セクション「レイアウト」または中にトレンドラインを作成するときに早く尋ねることを忘れずに コンテキストメニュー。 関数R ^ 2のフラグを確認することを忘れないでください。

その結果、トレンドラインの変更と正確さの数が表示されます。

トレンドラインの異なるバリエーションを見た後、ユーザは自信の選択に応じて変わる可能性があるので、ユーザは自分自身に最も適したものを決定することができる。 最大係数はユニットであり、これは最大の精度を意味しますが、この値を達成することは必ずしも可能ではありません。

したがって、判定係数を見つけるためのいくつかの方法が考慮された。 ユーザーはその目的で最も最適なものを選択できます。

28 oct

こんにちは、親愛なるブログの読者! 今日は非線形回帰について話します。 決定 線形回帰 リンクを見ることができます。

この方法 それは主に経済的モデリングと予測に使われています。 彼の目標は、2つの指標の間の依存関係を非難して特定することです。

基本タイプ 非線形回帰

  • 多項式(二次、立方体);
  • 双曲線
  • パワー;
  • 気持ちいい。
  • 対数

様々な組み合わせも使用することができる。 例えば、銀行部門における一時的なシリーズの分析のために、保険、人口統計学的研究はGompezer曲線によって使用され、それは一種の対数回帰である。

非線形回帰を使用した予測では、相関係数を見つけるための主なものが、2つのパラメータを持つ蜂蜜の密接な相互接続があるかどうかを示すための主なものです。 原則として、相関係数が1に近い場合は、接続があることを意味し、予測は非常に正確になります。 非線形回帰のもう1つの重要な要素は平均相対誤差です( だが )間隔にある場合<8…10%, значит модель достаточно точна.

これで、おそらく理論的なブロックは終了し、実際の計算に進みます。

15年間の車の販売テーブルがあります(それを表す)、測定ステップの数は議論の数になります。これらの期間の収益もあります(yを表します)将来の収益 次の表を作成します。

勉強するためには、式(Xからの依存性Y)を解く必要があります.Y \u003d AX 2 + BX + C + E。 これは一対の二次回帰です。 この場合、この場合の最小二乗法は、未知引数を決定するために、A、B、C。 フォームの代数式のシステムにつながります。

このシステムを解決するために、例えば駆動方法によって使用する。 システムに含まれる量が未知の係数であることがわかります。 それらを計算するには、テーブル(D、E、F、G、H)に数列を追加します。計算の意味 - 列D、Xの正方形へのX、INの場合、中の列に、 4度、g、xおよびy、x内のx(x)中、xからyの変数へのx

式を解くのに必要な形式の表で埋められることが判明します。

マトリックスを形成します A. 方程式の左側の部分には、未知の係数からなるシステム。 A22セルに配置して電話しましょう a \u003d。"。 私たちは回帰を解決することに選出した方程式のシステムに従います。

すなわち、B21セルでは、4次元F17のXインジケータが正立された列の量を配置しなければならない。 細胞に落ちたところ - "\u003d F17"。 次に、キューブE17のXが必要な列の量が必要です。その後、システムに厳密に進みます。 したがって、マトリックス全体を埋める必要があります。

クレアマアルゴリズムに従って、マトリックスA1が、最初の列の要素の代わりに、システム方程式の右側部分の要素を配置する必要があるAと同様に行列A1を有する。 すなわち、正方形のX列の合計にy、xy列の合計とy列の合計が乗算されます。

また、2つのマトリックスを必要とします - 2番目と3番目の列が方程式の右側の部分の係数からなるA2とA3と呼びます。 写真は次のとおりです。

選択されたアルゴリズムに続いて、結果の行列の決定要因(決定要因D)の値を計算する必要があります。 私達はモップされた式を使います。 結果はセルJ21:K24に配置されます。

RIN方程式の係数の計算は、以下の式によって、対応する決定基の反対側のセルで生成されます。 a. (セルM22) - "\u003d K22 / K21"; b (セルM23) - "\u003d K23 / K21"; から(M24セル) - "\u003d K24 / K21"。

私達は私達の望ましいペア二次回帰方程式を得る:

y \u003d -0.074x 2 + 2,151x + 6,523

相関インデックスによる線形通信を推定しましょう。

計算するには、追加の列jをテーブルに追加します(y *を呼び出しましょう)。 計算は次のとおりです(米国で取得した回帰式によると) - "\u003d $ m $ 22 * b2 * b2 + $ m $ 23 * b2 + $ m $ 24"。セルJ2に位置付けます。 オートコッシルマーカーをJ16セルに延伸したままになります。

金額(Y-Y平均化)2を計算するには、対応する式で表kおよびlに列を追加します。 列Yの平均はSRVNOW関数を使用して考慮されます。

K25セルでは、相関インデックス計算式 - "\u003d root(1-(k17 / L17))"を配置します。

0.959の値が1に非常に近いことがわかりました、そして、売上と年の間には密接な非線形接続があります。

結果として得られる二次回帰式(決定指数)を適合させることの品質を評価することは残っています。 相関指数の正方形の式を使用して計算されます。 すなわち、K26細胞の式は非常に単純であろう - 「\u003d K25 * K25」であろう。

0.920の係数は1に近い。これは高品質のフィットを示します。

最後のアクションは相対エラーの計算になります。 列を追加して式:「\u003d ABS((C2-J2)/ C2)、ABS - モジュール、絶対値を入力します。 マーカーを下にシフトさせることによって、M18セルで、平均値(SRVNA)を引き出し、フォーマットセルパーセントを割り当てます。 得られた結果 - 7.79%は許容エラー値内です<8…10%. Значит вычисления достаточно точны.

得られた値が必要な場合は、スケジュールを構築できます。

例のファイルが添付されています - リンク!

カテゴリー: / / 2017/10/28から

統計における構築モデルの品質を記述する指標の1つは、決定係数(R ^ 2)であり、これは近似の精度の値とも呼ばれる。 それを使って、あなたは精密予測のレベルを決定することができます。 さまざまなExcelツールを使用してこのインジケータを計算する方法を学びましょう。

決定係数のレベルに応じて、モデルを3つのグループに共有するのが慣例です。

  • 0.8 - 1 - 良質のモデル。
  • 0.5 - 0.8 - 許容品質のモデル。
  • 0 - 0.5 - 品質が悪いモデル。

後者の場合、モデルの品質は予測のための使用不可能性を示す。

Excelで指定された値を計算するための方法の選択は、回帰が線形であるかどうかによって異なります。 最初のケースでは、機能を使用できます kvawson.そして2番目に分析パッケージから特別なツールを使用する必要があります。

方法1:線形関数を用いた判定係数の計算

まず第一に、線形関数を持つ決定係数を見つける方法を見つけます。 この場合、この指標は相関係数の二乗に等しくなる。 以下に示す特定の表の例の埋め込みExcel関数を使用して計算します。


方法2:非線形関数における決定係数の計算

しかし、所望の値を計算するための上記の選択肢は線形関数にのみ使用することができる。 非線形関数で計算をするにはどうすればいいですか? Excelで機会があります。 ツールを使って行うことができます 「回帰」これはパッケージの不可欠な部分です "データ解析".

  1. しかし、指定されたツールを使用する前に、自分自身を有効にする必要があります 「分析パッケージ」Exceleのデフォルトで無効になっています。 タブに移動します "ファイル"それからアイテムを通過します "パラメーター".
  2. 開くウィンドウで、セクションに移動する "加える" 左垂直メニューへのナビゲーションを使用します。 右側のウィンドウの下部にある、フィールドは配置されています "コントロール"。 利用可能なリストからサブセクションを選択します "Excelアドイン..."そしてボタンをクリックしてください 「行く...」フィールドの右側にあります。
  3. ウィンドウが起動されます。 その中央部では、利用可能なアドオンのリストがあります。 このポジションの近くにチェックボックスをインストールします 「分析パッケージ」。 これに続いて、ボタンをクリックする必要があります。 OK ウィンドウインタフェースの右側にあります。
  4. ツールパッケージ "データ解析" 現在のインスタンスでは、Excelが有効になります。 それへのアクセスはタブのリボンにあります "データ"。 指定されたタブとボタンの粘土に移動 "データ解析" 設定グループに "分析".
  5. 有効ウィンドウ "データ解析" 特殊情報処理ツールのリストを使用して。 このリスト項目から割り当てます 「回帰」 そしてボタンの粘土 OK.
  6. その後、ツールウィンドウを開きます 「回帰」。 最初の設定ブロック - 「入力データ」。 ここでは、引数と関数の値がある範囲のアドレスを指定する必要があります。 カーソルをフィールドに入れてください 「入力間隔y」 そしてシート上の列の内容を強調表示する "y"。 配列のアドレスがウィンドウに表示された後 「回帰」、フィールドにカーソルを置きます 「入力間隔y」 そして同じ方法でセル列を割り当てます "バツ".

    パラメータ近く "鬼ごっこ" そして 「コンスタンツゼロ」 フラグは置かれません。 チェックボックスはパラメータの近くにインストールできます 「信頼性レベル」 そして逆のフィールドで、対応するインジケータの希望の値を指定します(デフォルトは95%)。

    グループで 「出力パラメータ」 どの領域に計算結果を表示するかを指定する必要があります。 3つの選択肢があります。

    • 現在のシート上のエリア。
    • 別のシート。
    • もう一つの本(新規ファイル)。

    ソースデータと結果とが1つのワークシートに配置されるように、第1の実施形態であなたの選択を確立する。 スイッチをパラメータの近くに置きます 「出力間隔」。 この項目の反対側のフィールドでは、カーソルを置きます。 シート上の空の要素の左側のボタンをクリックします。これは、計算の出力テーブルの左上のセルになるように設計されています。 この要素のアドレスはウィンドウフィールドで強調表示されている必要があります。 「回帰」.

    グループパラメータ "残り" そして 「通常の確率」 私はそれが重要ではないタスクを解決するために無視します。 その後、私たちはボタンで粘土です OK窓の右上隅にある 「回帰」.

  7. プログラムは、以前に入力されたデータに基づいて計算を行い、その結果を指定された範囲に表示します。 ご覧のとおり、このツールはさまざまなパラメータに関するかなり多数の結果を表示します。 しかし現在のレッスンの文脈では、私たちは指標に興味があります "R字形"。 この場合、0.947664に等しく、選択されたモデルを高品質のモデルとして特徴付けます。

方法3:トレンドラインの決定係数

上記の選択肢に加えて、判定係数は、Excelシート上に構築されたグラフ内のトレンドラインに直接表示することができる。 特定の例でこれを行う方法を調べてください。

  1. 引数テーブルと前の例で使用された関数の関数に基づいて構築されたスケジュールがあります。 トレンドラインを建設します。 スケジュールが残っている[構造]領域のどのサイトでもクリックします。 この場合、リボンに追加のタブのセットが表示されます。 「ダイアグラムの操作」。 タブに行きます "レイアウト"。 ボタンで粘土 "トレンドライン"これはツールブロックに投稿されています "分析"。 トレンドラインの種類の選択を持つメニューが表示されます。 特定のタスクと一致する型の選択を開始します。 この例のオプションを選択しましょう。 「指数近似」.
  2. Excelは、追加の黒い曲線の形でトレンドラインを構築する平面上に直接構築されます。
  3. 今私たちの仕事は実際の決定係数を表示することです。 トレンドラインを右クリックします。 コンテキストメニューが有効になります。 その時点で選択を止めます 「トレンドラインフォーマット...」.

    トレンドラインフォーマットウィンドウへの移行を実行するには、代替アクションを実行できます。 マウスの左ボタンを使ってトレンドラインを強調表示します。 タブに移動します "レイアウト"。 ボタンで粘土 "トレンドライン" ブロックで "分析"。 アクションリストの最良のポイントで粘土リストのリストに - "追加のトレンドラインパラメータ...".

  4. 上記の2つのアクションのうちのいずれかが、フォーマットウィンドウが起動され、追加設定を行うことができます。 特に、あなたがアイテムの反対側のチェックボックスをチェックする必要があるタスクを満たすために 「ダイアグラム上の近似精度の値(R ^ 2)の値を配置する(R ^ 2)。 窓の下部にあります。 すなわち、建設領域に決定係数の表示を含む。 その後、ボタンをクリックするのを忘れないでください "閉じる" 現在のウィンドウの下部にあります。
  5. 近似精度の値、すなわち判定係数の値は、建設領域の葉に表示される。 この場合、この値は0.9242に等しく、それは近似値を良質のモデルとして特徴付けます。
  6. 絶対にこのように、他の種類のトレンドラインの判定係数ショーを確立することができます。 上記のように、リボンのボタンまたはそのパラメータのコンテキストメニューのボタンを遷移させることで、トレンドラインの種類を変更できます。 その後、グループ内のウィンドウ自体で 「トレンドラインを構築」 他の種類に切り替えることができます。 アイテムについてのコントロールを制御することを忘れないでください 「ダイアグラムの近似精度の値を置きます」 チェックボックスが選択されました。 上記の操作が完了したら、ボタンをクリックしてください "閉じる" ウィンドウの右下隅に。
  7. 線形タイプでは、トレンドラインはすでに0.9477に等しい近似の精度の値を示します。これは、このモデルを特徴付けています。
  8. したがって、異なる種類の傾向線を切り替え、それらの近似信頼性値を比較する(判定係数)、モデルが送信されたスケジュールを最も正確に説明するオプションを見つけることができます。 最高の決定率のオプションは最も信頼性が高いでしょう。 そのベースでは、最も正確な予測を構築することができます。

    例えば、当社の場合、最高レベルの信頼性が2度の傾向の多項式を有することを確立することが可能であった。 この場合の決定係数は1である。これは、指定されたモデルが絶対的に信頼できることを示唆しており、これはエラーの完全な例外を意味します。

    しかし、同時に、これは別のグラフの場合、このタイプのトレンドラインも最も信頼できるものになるでしょう。 トレンドラインの種類の最適な選択は、スケジュールが構築された基準で、関数の種類によって異なります。 ユーザが最高品質のオプションを推定するためにユーザが「目の上に」の知識を有していない場合、上記の例に示すように、最良の予測を決定する唯一の出力は判定係数の比較である。

MS Excelパッケージは、線形回帰方程式の構造を非常に迅速に作動させることを可能にします。 得られた結果をどのように解釈するかを理解することが重要です。

働ければならない 分析パッケージメニュー項目で有効にしたいです サービス\\ add-in.

分析パッケージを有効にするには、Excel 2007では、ブロックをクリックする必要があります。 エクセル設定左上隅のボタンを押してからボタンを押すことによって エクセル設定»ウィンドウ下部にある:



回帰モデルを構築するには、項目を選択する必要があります サービス\\ Data Analysis \\ Regression。 (Excel 2007では、このモードはブロック内にあります データ/データ解析/回帰)。 ダイアログボックスが入力されているように見えます。

1) 入力間隔Y ➤パフォーマンスの値を含むセルへのリンクが含まれています y。。 値は列に配置する必要があります。

2) 入力間隔X ④係数の値を含むセルへのリンクを含みます。 値は列に配置する必要があります。

3)符号 タグ 最初のセルに説明テキスト(データシグネチャ)が含まれている場合は発生します。

4) 信頼性レベル ❖これはデフォルトで95%と見なされる信頼確率です。 この値が適していない場合は、この機能を含めて希望の値を入力する必要があります。

5)符号 コンスタンツーゼロ 空き変数が必要な方程式を構成する必要がある場合はオンになります。

6) 出力パラメータ 結果を配置する場所を決定します。 デフォルトのモードはです 新しい作業シート;

7)ブロック 残留物 残余の出力とそれらのグラフの構築を有効にすることができます。

その結果、必要な情報をすべて含み、3つのブロックにグループ化されている情報が表示されます。 回帰統計, 分散解析, 結論残差。 それらをより詳細に考えます。

1. 回帰統計:

複数 r 式によって決定される( ピアソン相関係数);

r (決定係数);

norm r-kvadratは式によって計算されます (複数回帰に使用されます)。

標準誤差 s 式によって計算された ;

観測×これはデータ量です n.

2. 分散解析、ライン 回帰:

パラメータ dF。 カラス m (要因のセット数 バツ。);

パラメータ ss。 式によって決定される。

パラメータ MS。 式によって決定される。

統計 f 式によって決定される。

意義 f。 得られた数が超えると仮説が取られ(線形的な関係はない)、そうでなければ仮説が取られる(線形関係がある)。


3. 分散解析、ライン 残基:

パラメータ dF。 等しい;

パラメータ ss。 式が決定されます ;

パラメータ MS。 式によって決定されます。

4. 分散解析、ライン 合計 最初の2列の合計を含みます。

5. 分散解析、ライン y断面 係数、標準エラーの値が含まれています t-統計。

p-notion†は計算に対応する有意性のレベルの値です。 t-統計。 Stouturaspの機能によって決定されます( t-統計; )。 もし p-notionは、対応する変数が統計的に重要ではなく、モデルから除外することができます。

95%低い そして トップ95% ◦これは、線形回帰理論式の係数に対する95パーセント信頼区間の下限および上限です。 データ入力ブロックでは、信頼確率値がデフォルトで残された場合、最後の2列は前のものを複製します。 ユーザーが信頼確率を入力した場合、最後の2列には、指定された信頼確率の場合は下限と上限の値が含まれています。

6. 分散解析、文字列には係数の値、標準エラーの値が含まれています。 t- スタティシスト p- 関連する近似と信頼区間。

7.ブロック 結論残差 予測値が含まれています y。 (私たちの指定で)そして残骸。

回帰線は現象との関係のグラフィック反映です。 Excelでは明らかに回帰ラインを作成することができます。

これのために必要なので:

1. Excelプログラムを抽出します

2.データを含む列を作成します。 私たちの例では、積極的な攻撃と不確実性の間に、積極的な攻撃と不確実性の間に、積極的な回線または相互関係を構築します。 実験では、30人の子供が参加し、データは特別な表に表示されます。

1列 - テスト番号

2つのコルマド - 積極的 バラートで

3コレンシド - diff diff バラートで

3.次に、両方の列をハイライトする必要があります(列の名前なし)、タブをクリックします。 インサート , 選ぶ p 最初のものを選ぶために提案されたレイアウトから マーカーで熟練しています .

4.それでは、回帰回線のための空白を得ました - いわゆる - 散乱図。 回帰回線に移動するには、結果の描画をクリックしてタブをクリックする必要があります。 コンストラクタ、 パネルを見つけてください レイアウト図 そして選ぶ m だがket9。 それはまだそれに書かれています f(x)

5.そして我々は回帰ラインを持っています。 グラフはまた、その式と相関係数の二乗を示しています

6.チャート名、軸の名前があります。 また、凡例を削除することもでき、水平メッシュライン数を減らすこともできます(タブ レイアウト その後、 グリッド )。 メインの変更と設定はタブで行われます。 レイアウト

回帰回線はMS Excelで構築されています。 今すぐ作業のテキストに追加することができます。

トピックを続ける:
インターネット

Windowsブートディスクを作成する最も一般的な方法の1つは、この記事で説明されている方法です。 そしてより正確に創造の中で、それは遠い世界で私たちを助けるでしょう...