054_適切なデータ区間設定でヒストグラムを作成することができる

※Excelで作ってもいいけど、Pythonやmatplotlibでも作れそうだな

1:データの最大値と最小値を求める

2:データの最小値と最大値からヒストグラムの下限値と上限値を決定し、その値をもとに、ヒストグラムのデータ区間を設定します。
→分布をできるかぎり明瞭 かつ ただしくとらえたい or 伝えたい ――という趣旨のもと、誤読をふせぐ意味合いからも、これは原則としては 等間隔であるべき

→また、棒グラフの境界線上に当たるデータが存在する場合、棒 A か棒 B かどちらでカウントすべきか…という問題が生じてしまう。そのため、境界値を設定するとき, 境界値の上にデータが存在しないような値を設定すること が求められることもある。

→階級の数:√n、階級の幅:範囲 ÷ √nで求めることもある。(平方根選択)
例えば、データの数 n は 24, 範囲は 65 万円の場合は、階級の数は 5 個、階級の幅は 14 万円…という値がみちびかれる。
他にも、スタージェスの公式、スコットの選択、フリードマン=ダイアコニスの選択なんてのもある。

3:FREQUENCY関数を使って度数分布表を作成する
→累積相対度数線を使うと、より綺麗にみることができる。

http://www.ipc.tohoku-gakuin.ac.jp/~neichi/lectures/statistics/histogram_win7.html

http://hitorimarketing.net/tools/histogram.html