エビデンス全般

統計基礎:2変数間の検定

t検定

アウトカムが連続値であるときに使用される基本的な検定が「t検定」です。

t検定(t-test)は、統計学において2つの母集団の平均値の差が有意かどうかを検定する手法です。

t検定は、母分散が未知の場合に利用されます。

t検定によって得られるt値は、帰無仮説(2つの母集団の平均値が等しい)が正しい場合のt分布に基づいて計算されます。

t値が大きいほど、帰無仮説が正しい可能性が低くなります。

t検定を行う際には、有意水準と呼ばれる閾値を設定する必要があります。

有意水準が5%ならば、帰無仮説が正しい場合に5%の確率で誤りとなる結果が得られることを意味します。

母分散とは

母分散(population variance)は、統計学において母集団の数値データのばらつきを表す指標です。

母分散は、母集団内のすべてのデータの値と母集団平均との差の2乗値を全体のデータ数で割ったものになります。

母分散が大きい場合、「母集団内のデータの値のばらつきが大きい」ことを意味します。

t検定の結果の解釈ポイント

結果の解釈では、主に次の4つの観点が肝になります。

  • t:t値
  • p-value:P値
  • 95% confidence interval:平均の差の95%信頼区間
  • mean:両群の平均値

Wilcoxonの順位和検定

Wilcoxonの順位和検定(Wilcoxon rank-sum test)は、統計学において2つの母集団の平均値の差が有意かどうかを検定する手法です。

Wilcoxonの順位和検定は、母分散が未知か不均等である場合に利用されます。

この検定では、2つの母集団から得られたデータを結合し、全てのデータに順位をつけます。

順位が小さいデータの数が多い方の母集団と大きい方の母集団を比較することによって、2つの母集団間で有意な差があるかどうかを決定します。

この検定も帰無仮説と有意水準を設定することが必要です。

帰無仮説は、2つの母集団の平均値が等しいというものです。

t検定と同様にデータが連続値の時に用いる検定ですが、t検定は正規分布を仮定しているのに対して、Wilcoxonの順位和検定は正規分布を仮定していない、という違いがあります。

正規分布の仮定がない、というのは「正規分布を仮定できない分布でも使える」という強みがあるとも言い換えられるでしょう。

一般的に「仮定」や「前提条件」のような縛りがない方が応用範囲は広くなります。

χ二乗検定(かいにじょうけんてい)

χ2乗検定(Chi-squared test)は、統計学においてカテゴリカルデータに対する統計的な検定を行う際の手法です。

カテゴリー変数どうしを比較する際に用いられる検定として、基本的なものがχ二乗検定になります。

χはギリシャ文字で「カイ」と読みます。

この検定では、予想される頻度と実際に観測された頻度を比較します。

帰無仮説が正しい場合には、予想される頻度と実際に観測された頻度が一致することが期待されます。

この検定には、χ2分布に基づく検定統計量を用います。

χ2分布(Chi-squared distribution)

χ2分布(Chi-squared distribution)は、確率論と統計学においてよく使われる確率分布の一つです。

この分布は、平方和の正規分布に基づくものであり、自由度(degrees of freedom)と呼ばれるパラメータによって形状が決まります。

χ2分布は、平均が自由度であり、分散も自由度であることが知られています。

また、χ2分布は、特に大きな値をとる確率が小さいことが特徴です。

Fisherの正確検定

検定を行いたくても、十分なサンプルサイズが集められない場合は珍しくありません。

そんな場合には「Fisherの正確検定」の利用を検討してみましょう。

Fisherの正確検定 (Fisher's Exact Test) は、2 x 2のカテゴリデータを扱うカイ2乗検定の代替として用いられる統計的検定の方法です。

この検定は、カテゴリデータの独立性を検定する際に用いられます。

例えば、治療グループと対照グループの間に有意な差があるかどうかを判定するために用いられます。

Fisherの正確検定は、小さな標本数や非常に不均衡なカテゴリデータに対しても適用できます。

一方、カテゴリデータが大きすぎる場合や多項式データを扱う場合には、適用できないこともあります。

-エビデンス全般

© 2024 RWE