単回帰分析について最小二乗法、回帰係数、標準誤差の説明ができる

解説

・最小二乗法
→測定値との差の2乗和が最小となる関数の式を求める方法

・回帰係数
→ 回帰式を y=α+βx とするとき,αを定数項,βを回帰係数(単回帰係数)という.

・標準誤差
→標準誤差(standard error of mean):そのデータの平均値のありそうな幅。
標準誤差とは,標準偏差を √N で割ったもの。式から明らかなように,標準誤差は標準偏差よりも必ず小さくなります.この性質のため,標準誤差を用いてグラフを作成したほうがデータのバラつきが少ないように見え,カッコよくなります..ではなぜ標準偏差ではなく,標準誤差を使うのでしょうか?グラフをカッコ良く見せるためではありません.ズバリその理由は,標準誤差によって母集団の平均値の区間推定を行えるから

※標準偏差(standard deviation):そのデータのばらつきの程度を表す。標準偏差が
データのバラつきを表す指標として適切なのは,そのデータの分布が正規分布に近い時に限ります.

上記を含め、最小二乗法の理論的基盤には次のような前提が設けられている[1]。
・測定値の誤差には偏りがない。すなわち誤差の平均値は 0 である。
・測定値の誤差の分散は既知である。ただし測定データごとに異なる値でも良い[2]。
・各測定は互いに独立であり、誤差の共分散は 0 である。
・誤差は正規分布する。
・m 個[3]のパラメータ(フィッティングパラメータ)を含むモデル関数f が知られていて、測定量の真の値を近似誤差なく再現することのできるパラメータが存在する。
→これ、よくわかってないけど、単純に最小二乗法を利用するのってだめなんかな?もう少し調べるか。。

異常値の除去[編集]
前提条件の節で述べたように、測定データを最小二乗法によって近似する場合、外れ値または異常値が含まれていると極端に近似の尤もらしさが低下することがある。また、様々な要因によって異常値を含む測定はしばしば得られるものである。
誤差が正規分布から極端に外れた異常値を取り除くための方法として修正トンプソン-τ法が用いられる。

・標準偏差とはデータのバラつきの指標でした.X¯ ± 2S D の範囲にデータが入る確率が 95% となるのです.
ですから,データのバラつきを示したい,あるいは比べたい時は標準偏差を使うべきです.例えばある因子に
よって,データがバラつかなくなるというようなことを示したい場合などです.一方で,標準誤差とは,母平均 µ の区間推定量でした.X¯ ± 2S E の範囲に母平均 µ がある確率が 95% となるのです.よって,母平均 µ の推定をしたい,あるいは比べたいという時は標準誤差を示せばいいのです.多
くの場合,実験によって知りたいのは母平均 µ であるので,多くの論文で標準誤差が示されているのですね.

・回帰係数
http://www.geisya.or.jp/~mwm48961/statistics/kaiki1.htm

・標準誤差
http://www.acs.dis.titech.ac.jp/suzuki/sdandse.pdf

ステップアップ

キーワード

相関係数 相関の強さ
0.0~±0.2 ほとんど)相関がない
  • 最小二乗法
  • 回帰係数
  • 標準誤差
  • XXX
  • XXX

ソースコード

XXX.py:XXXするプログラム

このプログラムを実行すると、与えられた配列の中央値を算出します。

データセット