037_様々な分散分析の考え方(一元配置、多重比較、二元配置)を理解して、パラメトリックな多群の検定を活用することができる

■一元配置分散分析(one-way ANOVA):ある一因子の群間で平均値に差があるかどうかを調べるための手法
例えば、3群以上の平均値の比較をするときには、各群が正規性分布に従うか(=バートレット検定)をまずは調べる。従えば、ANOVA、従わなければノンパラメトリックの多群クラスカル・ウォリス検定を用いる。
帰無仮説H0は「各群間に差はない」、対立仮説H1は「各群間に差はある」となる。
※どの群に差があるかを確認するには、多重比較が必要となる。

■多重比較:3つ以上の群で、個々の群と群を検定する場合に、有意水準を上げずに行う検定法。
ボンフェローニ(Bonferroni)の方法、シェッフェ(Scheffe)の方法、テューキー(Tukey)のHSD等が、多重比較には存在する。
★お勧めはTukeyのHSD→全ての群間の比較について誤差分散を使ったt0統計量を計算して、スチューデント化された範囲の分布(t分布ではない)と呼ばれる分布から有意水準を調整して検定する方法である。
※ANOVAを行った後に、多重比較を行うことは、検定の多重性の問題が出るので行うべきではない。という意見もある。
→つまり、、、多群のうち2群間には差があるがその他はほぼ一様でANOVAをおこなうと有意差なしとなってしまうこともある。この場合その2群間の差に注目したくても無視されてしまう。この場合最初からTukey法やDunnett法を用いれば有意差が検出できる。つまり、ANOVAは状況によりかなり保守的となってしまうので、ある群間に注目するならばANOVAは用いず最初から多重比較(Tukey法、Dunnett法、Bonferroni法など)を適用した方がよい。(http://www.ibaraki-kodomo.com/toukei/posthoc.html)

https://software.ssri.co.jp/statweb2/tips/tips_11.html
→一元配置分散分析の算出の実例あり。

http://www.ibaraki-kodomo.com/toukei/posthoc.html
!検定の多重性の問題
ひとつの実験系で、統計的検定を繰り返すことをいう。
検定を繰り返すことにより、1回のみ検定を行った場合より第一種過誤率が大きくなってしまう。
すなわち、有意差がでる可能性が高くなってしまう。

A,B,Cの3群について、A-B,A-C,B-Cの すべてについて2標本t検定を行うと、それぞれについては危険率5%で判定していても、全体としては危険率が14%になって有意差がでやすい検定をしていることになってしまうのである。
危険率5%であるから、有意差がでない確率は(1-0.05)となる。3つの組み合わせ全てで有意差が出ない確率は(1-0.05)x(1-0.05)x(1-0.05)となり、逆に有意差が出る確率は1-(1-0.05)3=0.142となるからである。

ところで、すべての組み合わせで2標本t検定を行なうとB-C間のみに有意差がでるが、3群について分散分析または多重比較をすると有意差が出ない場合について考えてみる。この場合最初から3群を選択して検定した場合には有意差なしとなるが、B、Cのみに着目して検定した場合には有意差ありとなる。これはおかしなことではあるが、多重比較の前提として、何を比較するか、つまりファミリーとして何を選択するかをまず決定してから検定することが重要なのである。多群についていろいろな組み合わせで検定した後に、有意差のあるもののみ選択したようにみせかけたり、後から群を増やして有意差なしとするような検定は誤りである。

■二元配置

例えば,3カ国の男性の平均身長の違いは国籍に関係あるのかといった場合,
国籍がグループを識別する(唯一の)要素になります.このように,グループを識別する要素が1つのものを一元配置のデータと呼ぶ
二元配置は、これの要素が2つのバージョン。
2つの要素による相乗効果はあるのかを分析することが二元配置の分散分析の主要な目的

http://www.aoni.waseda.jp/abek/document/anova.html
→算出している実例あり。

■パラメトリック:多重比較の方法のリスト(http://www.ibaraki-kodomo.com/toukei/posthoc.html)
1)Fisher’s PLSD法
 ・F検定量を用いている。分散分析で有意な場合に用いる。
 ・有意差が出やすい(αエラー増大)
 ・各群のデータ数、分散が等しいことが仮定(データ数が等しくなくても使えるように汎用性を持たせたものもある)
 ・4群以上では使用してはいけない.
2)Scheffeの方法(シェフェ)
 ・有意差が出にくい
 ・適応範囲が広い
 ・各群のデータ数の均一性などの制限がない。正規性は必要。
 ・多群間のANOVAで変動が有意であった場合(F検定量を用いている)。逆にいうとScheffe 法で有意差が出ると一元配置分散分析でも有意差が出る。
3)Bonferroni 法(ボンフェローニ)
 ・検定全体の有意水準を検定数で割った値を有意水準とする
  (例えば、群数が3つの場合には3組の検定を行うので0.05/3=0.016を有意水準とする)
 ・ANOVAで有意差がなくても検定できる(併用すると多重性が問題?)
 ・5つ以上の群にこの手法は用いない方がよい(多すぎると検出力が極端に落ちる)
4)Dunnett法(ダネット)
 ・コントロール群と実験群の間の多重比較法(経時的に個体を追って測定したデータには適応困難との指摘もある)
 ・正規性が必要。データ数は不一致でもよい。
 ・群間に順位が想定できればWilliams法を用いること
5)Williams法
 ・正規性、等分散性、データ数一致
 ・群の母平均値に順番が想定可能な場合(例えば、ある薬物の効果判定でコントロール群と、1から3群までに用量を順次増加させて投与した場合)
6)Tukey-Kramer法(テュキー・クレーマー)
 ・全ての群間の対比較
 ・等分散性、正規性が必要であるが、データ数は不一致でもよい(Tukey法はデータ数一致が必要)。
 ・検出力が高く、有意差がでやすい。
7)Games/Howell 法(ゲイムスーハウエル)
 ・F検定量を使用
 ・正規性、データ数一致、等分散性など制約がなく非常に頑健(Stat Viewでは特定の手法を望むのでなければ、この方法が有用という)。

ノンパラメトリック法の多重比較もなくはない。