012_代表的な確率分布の特徴を5つ以上説明できる

解説

試行の結果により、その値をとる確率が定まる変数を確率変数といいます。また、確率変数とその値をとる確率との対応を示したものを確率分布と呼びます。以下で、代表的な確率分布を紹介します。

離散型確率分布

分布種別 説明 特徴
二項分布 XXXX XXXX
ポワソン分布 単位時間あたりに平均 λ 回起こる現象が、単位時間に k 回起きる確率」を表すのに使われる確率分布のこと XXXX
幾何分布 XXXX
負の二項分布 XXXX

二項分布 Bin(n,λ/n) において,サンプルの数 n を,n→∞ としたときの極限分布が,ポアソン分布 Po(λ) となることが知られています。

ポアソン分布では,平均と分散が等しくなるということが最重要です。

2項分布は、n が大きくなるほど、計算が非常に大変になってしまい、その場合は実用的とはいえません。そこで、p が小さいときに限り、近似式を応用して考えようとするのがポアソン分布(Poisson Distribution)です。

連続型確率分布

  • 正規分布(ガウス分布)
  • 対数正規分布
  • 指数分布
  • ワイブル分布

推測統計で用いられる確率分布

  • 標準正規分布
  • t分布
  • カイ2乗分布
  • F分布

 

ステップアップ

どの分布に属するか・・・
いろいろな手法で正規分布かは見れる
かいじじょうでポアソンは確認家の樹

キーワード

  • 確率変数
  • 確率分布
  • 離散型確率分布
  • 二項分布
  • ポワソン分布

ソースコード

correlation_coefficient.py(github):相関係数を算出するプログラム

# coding:utf-8
import numpy as np

# 来客数
x = [220,250,270,300,350,400,410,450,510,580]
# 売上高
y = [120,150,140,210,201,280,204,290,310,370]

def correlation_coefficient(x,y):

    # 相関係数の計算
    corr = np.corrcoef(x, y)

    # 結果の表示
    print(u"相関係数:" + str(corr[0,1]))


if __name__ == '__main__':
    correlation_coefficient(x,y)

このプログラムを実行すると、来客数と売上高の相関係数を算出します。

相関係数:0.955840458153

データセット