今回のテーマは「サンプルサイズ と 記述統計 と リアルワールドエビデンス」です。
リアルワールドエビデンス関連で、実際に研究を計画しようと思い立った時に「あれ?」と壁に当たるものの一つがサンプルサイズの考え方です。
恐らく、治験などで比較対照群を置いて、非劣性試験などをデザインしている方ほど、このあたりに困ることが出てくるのではと感じています。
ヘルスケア業界で長く働いている方は、治験でほぼ必ず出てくる「有意差」や「p値(p-value)」等の言葉に慣れていますが、リアルワールドエビデンスの文脈では、必ずしも仮説検定を行うことが出来るわけではない(より踏み込んで言えば、無理に検定を行う必要がない場合がある)ため、サンプルサイズの考え方も治験のように仮説検定に縛られないという違いがあります。
治験の場合は、比較対照群を置いて新治療の有効性が優れていることを示して、承認を得るという至上命題があるので、「比較」が重要になります。当然ながら、補足情報として記述統計の値を示すことはあり得ますが、主たる結果は「対象群よりも優れている」というものはしばらくは揺らがないでしょう。
記述統計におけるサンプルサイズ
記述統計におけるサンプルサイズを計算するためには、次の3点を決める必要があります。
- 信頼係数を何%に設定するか。
- 信頼係数とは、母数を区間推定するときに、母数が信頼区間内に含まれる確率を指します。信頼係数は、一般的には90%や95%などと設定されます。念のためですが、p値とは異なります。
- 誤差をどの程度まで許容するか。
- 例えば、疾患Aに罹患している方々の血液検査値Xの値(単位はmg/dl)について、±10 mg/dl の精度で区間推定したい場合は、「誤差は10mg/dlまで許容する」となります。
- 母集団の標準偏差σの値をどうするか。
- ここが厄介なのですが、まずは先行研究で似たような研究があるなら、その研究で設定されているσの値が一つの参考になります。もし参考に出来るものが何一つないのであれば、さすがに直観であったり誰かの意見で決めるわけにはいかないので、標本データから計算した値(不偏分散の平方根)を用いる場面も出てくるでしょう。その場合、母集団の標準偏差よりも小さく見積もっている可能性がある点に注意が必要です。
これらを決定すれば、サンプルサイズをどのくらいにすればいいのかを計算することができます。
信頼係数を95%に設定した場合、標準誤差は下記の式で表されます。
$$標準誤差=1.96×\frac{σ}{\sqrt{n}}$$
あとはこの等式をnについて解けばいいので、
$$n=(\frac{1.96×σ}{標準誤差(ここに許容できる誤差の値を入れる。単位はσと揃えて。)})^2$$
となります。
大学で学ぶ統計学の授業に比べたら物凄くシンプル過ぎて肩透かしを食らう方も多いことでしょう。
リアルワールドエビデンス関連のサンプルサイズ計算では、まずは以上のような考え方もあるという、ある種の読み物として捉えてみてください。