015_重回帰分析において偏回帰係数と標準偏回帰係数、重相関係数について説明できる

重回帰分析:(購入額)= a ×(年齢)+ b ×(性別)+ c ×(家族人数)+ d ×(年収)+(誤差)という式において、a,b,c,d の値と、誤差項の値を求めます。求め方は、最小二乗法の原理が用いられます、

・偏回帰係数
→a,b,c,dのこと

・標準偏回帰係数
→説明変数を標準化してもとめた偏回帰係数を標準偏回帰係数といい、この標準偏回帰係数の大きさで、説明変数の説明力(目的変数への影響の大きさ)を比較する。
※説明変数を標準化(平均0、分散1。単位が異なるため。例えば、年収と年齢の偏回帰係数は、そのままでは比較することができないため。→重要度ランキングを把握できる。
※標準化しなければ、各説明変数の目的変数に対する貢献度が把握できる。

・重相関係数
→重相関係数とは、基準となる1つの変量と、これとは別の複数の説明変量から合成した合成変量との相関を表わすもの。重相関係数(Rと表わすことが多い)が1に近いほど、重回帰分析モデルが現実をよく表わしていることになります
(つまり、基準変量である実際の購入額と、購入者の属性から重回帰分析式で求めた予測値の相関を表す)

http://www.macromill.com/landing/words/b002.html

https://istat.co.jp/ta_commentary/multiple_02

重相関係数(R)の2乗を、決定係数(R2)といいます。決定係数(R2)は、基準変数の分散に占める予測値の分散の割合に一致するので、重回帰分析の適合度指標としてよく用いられます。

・代替R2が0.8以上(精度良い)、0.5(精度まあまあ)とか。

■重回帰分析に適用できるデータの制約
① ある説明変数のデータが全て同じ場合、重回帰分析は実行できません。
② 任意の複数項目を選択し、個体ごとにその項目のデータの合計を計算したとき、どの個体も合計値が同じになる場合、重回帰分析は実行できません。
③  重回帰分析に適用するデータは次式の条件を満たしてなければなりません。
 個体数>説明変数の個数+1
 先に示した営業所売上予測データについて調べると、「説明変数の個数+1」は3です。従って個体数は4以上必要です。<測定データ>の個体数は200人なので、このデータは重回帰分析が適用できます。

//図も入れます