記述統計とサンプルサイズについて

近年、医療分野においてリアルワールドデータ（RWD）とその分析から得られるリアルワールドエビデンス（RWE）の重要性が急速に高まっています。RWDとは、電子カルテ、レセプトデータ、患者レジストリ、ウェアラブルデバイスから得られるデータなど、日常診療や患者さんの生活から収集される多様な健康関連データを指します。そしてRWEは、このRWDを分析することで得られる、医薬品や治療法の実際の使用状況、有効性、安全性に関する科学的な根拠です。

RWEが注目される背景には、従来のランダム化比較試験（RCT）だけでは捉えきれない臨床現場の実態（多様な患者背景、長期的な影響、稀な有害事象など）を把握する必要性や、医療の個別化、効率化への要請があります。RWEは、医薬品の市販後安全性監視、有効性の補完的評価、費用対効果分析、診療ガイドラインの改訂など、多岐にわたる領域で活用が期待されています。

しかし、RWEを用いた研究を計画する際、特に初期段階で研究者が直面する課題の一つが「サンプルサイズ」の決定です。従来のRCT、特に比較対照群を設定し仮説検定（例：非劣性試験）を行う治験に精通している研究者ほど、RWE研究特有の状況下でのサンプルサイズの考え方に戸惑いを感じることがあるかもしれません。

Table of Contents

治験（RCT）とRWEにおけるサンプルサイズ設計思想の違い

伝統的なRCT、特に医薬品承認審査を目的とする治験では、新治療が既存治療やプラセボと比較して「優れているか（優越性）」、「劣っていないか（非劣性）」、あるいは「同等であるか（同等性）」を統計的に検証することが主要な目的となります。そのため、「比較」が研究デザインの中心となり、サンプルサイズは、設定した検出力（Power）で統計的な「有意差」（一般的にp値 < 0.05）を見出すために必要な数として、仮説検定の枠組みに基づいて算出されます。これは、限られた、しかし厳密にコントロールされた環境下で、介入の効果を明確に示すための重要なアプローチです。

一方で、RWE研究の目的はより多様です。もちろん、RWDを用いて治療効果の比較を行う研究（観察研究における因果推論）も重要な領域ですが、それだけではありません。特定の疾患を持つ患者集団全体の特性（罹患率、合併症、検査値分布など）を正確に把握したり、実際の治療パターンや薬剤の使用実態を詳細に記述したり、あるいは新たな仮説を生成したりすることもRWE研究の重要な役割です。このような「記述」を主目的とする研究、あるいは探索的な研究においては、サンプルサイズの考え方もRCTのような仮説検定の論理に強く縛られる必要はありません。むしろ、「どの程度の精度で母集団の特性を推定したいか」という観点が重要になります。

記述統計を目的としたサンプルサイズ設計：精度に基づくアプローチ

RWE研究において、母集団の特性（例：特定の疾患を持つ患者群の平均血圧、ある治療法を受けている患者の割合）を、事前に定めた精度で推定したい場合があります。このような記述統計的な目的のためには、仮説検定とは異なるアプローチでサンプルサイズを計算します。この計算には、主に以下の3つの要素を決定する必要があります。

信頼係数 (Confidence Level)

推定したい母数（母平均や母比率など）が、計算によって得られる「信頼区間」内に含まれると期待される確率です。慣例的に95%が用いられることが多いですが、これは「同じ方法で標本抽出と区間推定を100回繰り返した場合、そのうち約95回は真の母数が区間内に含まれる」ことを意味します。研究の目的や、結果の確実性に対する要求度に応じて、90%や99%などに設定することもあります。これは、仮説検定におけるp値（帰無仮説が真である場合に、観測された結果またはそれ以上に極端な結果が得られる確率）とは概念的に異なります。

許容誤差 (Margin of Error / Precision)

推定値と真の母数との間に許容できる最大の差（ズレの幅）を指します。これは、結果をどの程度の「精度」で報告したいか、という研究者の要求を反映します。例えば、ある疾患患者の平均血液検査値Xを推定する際に、「真の値から±10 mg/dlの範囲で推定できれば十分」と考える場合、許容誤差は10 mg/dlとなります。この値は、臨床的に意味のある最小差（Minimally Clinically Important Difference; MCID）などを参考に、研究分野の専門知識に基づいて慎重に設定する必要があります。許容誤差を小さく設定する（＝高い精度を求める）ほど、必要なサンプルサイズは大きくなります。

母集団の標準偏差 ( $σ$ ) または想定される割合 ( $p$ )

母平均を推定する場合

推定対象となるデータの「ばらつき」の大きさを示す母集団の標準偏差 ( $σ$ ) が必要です。この値を得る最も良い方法は、類似した対象集団に関する先行研究の報告値を参照することです。もし適切な先行研究が見当たらない場合は、小規模なパイロットスタディ（予備調査）を実施して標本標準偏差を計算し、それを $σ$ の推定値として用いることが考えられます。さらに簡易的な方法として、データの取りうる値の範囲（Range）から $σ \approx Range /4$ や $σ \approx Range /6$ として概算することもありますが、精度は高くありません。手元の標本データから計算した不偏分散の平方根（標本標準偏差）を用いる場合は、特にサンプルサイズが小さいと、真の $σ$ よりも小さく見積もってしまう可能性がある点に注意が必要です。

母比率を推定する場合（参考）

ある特性を持つ人の割合などを推定する場合は、標準偏差の代わりに、想定される割合 ( $p$ ) が必要になります。サンプルサイズ $n$ は、 $n = (許容誤差 Z)^{2} p (1 - p)$ （ $Z$ は信頼係数に対応する値、例えば95%信頼係数なら1.96）で計算されます。 $p$ が不明な場合は、サンプルサイズが最大となる $p = 0.5$ （50%）を用いるのが安全側の設定となります。

サンプルサイズの計算式（母平均推定、信頼係数95%の場合）

これらの要素が決まれば、必要なサンプルサイズ ( $n$ ) を計算できます。例えば、信頼係数を95%に設定した場合、母平均の推定における標準誤差とサンプルサイズの式は以下のようになります。

$$標準誤差=1.96×\frac{σ}{\sqrt{n}}$$

あとはこの等式をnについて解けばいいので、

$$n=(\frac{1.96×σ}{標準誤差（ここに許容できる誤差の値を入れる。単位はσと揃えて。）})^2$$

となります。

この計算方法は、大学で学ぶ統計学の基礎と比較すると非常にシンプルに感じられるかもしれません。しかし、リアルワールドエビデンス研究においては、このような記述統計に基づいたサンプルサイズの考え方も重要なアプローチの一つとなります。研究目的に応じて、仮説検定に基づく設計だけでなく、こうした考え方があることを知っておくことは有益でしょう。

サンプルサイズ設計における留意点

計算結果はあくまで目安

この計算式で得られるサンプルサイズは、設定した条件下での理論的な最小値です。実際の研究では、データ収集時の欠損や、追跡期間中の脱落などを見越して、算出した値に10%〜20%程度の上乗せをすることが一般的です。

実現可能性と倫理的配慮

必要なサンプルサイズが非常に大きくなる場合、研究の実現可能性（コスト、期間）や倫理的な側面（対象者への負担）も考慮する必要があります。精度と実現可能性のバランスを取ることが重要です。

分布の仮定

上記の計算式は、母集団が正規分布に従う、あるいはサンプルサイズが大きい場合に中心極限定理が適用できることを前提としています。データがこれらの仮定を満たさない可能性がある場合は、ノンパラメトリックなアプローチや、より専門的な統計手法の検討が必要になることもあります。

まとめ：研究目的に応じた柔軟なサンプルサイズ設計を

リアルワールドエビデンス研究におけるサンプルサイズ設計は、単一の方法論に固執するのではなく、研究の具体的な問い（Research Question）と目的に応じて柔軟にアプローチを選択することが肝要です。仮説検定を主眼とする場合は従来の検出力に基づいた設計が、母集団の特性を精度良く記述・推定することが目的であれば、本稿で紹介したような信頼区間の幅（精度）に基づく設計が適しています。

この記述統計的なアプローチは、一見シンプルに見えるかもしれませんが、RWE研究の多様な目的に対応するための重要な選択肢の一つです。研究計画の初期段階で、達成したい精度や利用可能なリソースを考慮し、統計専門家とも相談しながら、適切なサンプルサイズを決定することが、質の高いRWE創出の第一歩となるでしょう。

RWE研究のサンプルサイズ、どう決める？ 〜記述統計と精度の視点から〜