Table of Contents
因果推論とは
相関関係が本当なのか、因果関係もあるのかを検討していく過程を因果推論と言います。
相関関係とは2つの変数の関係で、どちらかが大きくなるほど、もう片方もある傾向で変化するというものです。
交絡因子などを介して相関関係があるように見えてしまう関係は、疑似相関と呼ばれます。
因果関係とは、片方の変化や差がもう片方の変化や差につながるという関係にあるものです。
まずは、因果関係が満たさなければならない3つの条件についてです。
因果関係の3条件
因果関係には、次の3つの条件をすべて満たす必要があるとされています。
時間的先行性
時間的先行性というのは、原因となる現象が結果となる現象よりも時間的に先に起こっている、ということです。
原因となる事象が先に起こっているというのは当然とも言えますが、とても重要なところです。
データを評価する際に、時系列情報まで加味するのは、実際のところ簡単ではないことが多いのが実情です。
例えば、体温の情報一つをとっても、「いつ測定したか」の正確な情報をいちいち記録していることはまれでしょう。
共変関係
共変関係というのは、原因となる現象が変化したときに結果となる現象も変化する、ということです。
相関関係と同じようなことを指しています。
解析の場面では「共変量」などという名前で出てきます。
他条件の同一性
他条件の同一性というのは、「交絡因子のようなものがない」状態である、あるいは「交絡因子があったとしてもその影響について考慮できている」状態、を指します。
交絡因子が全くないということはまれです。
実際には、交絡因子の影響を考慮できていることをもって、条件を満たすと考えるのがほとんどです。
反実仮想の例:ワクチン接種と感染
ワクチンを接種したら、感染症にかからなかった、という経験から因果関係を推論していく過程について考えてみましょう。
とった行動は「ワクチンを接種した」です。
この反対の事象は当然「ワクチンを接種しなかった」です。
結果は「感染症にかからなかった」で、反対の結果は「感染症にかかった」です。
この限られた情報からは因果推論として「ワクチン接種したから、感染症に罹患しなかった」と考えたわけですが、これでいいのでしょうか。
実際には起こらなかった反対の事象についても考えを巡らせることが重要になります。
このことを反実仮想といいます。
実際には「ワクチンを接種した」のですが、違う行動を取ったらどうなっただろうかということを考えるということです。
「ワクチン接種したから、感染症に罹患しなかった」が正しいなら、反対の行動をとった場合には反対の結果に繋がりそうですね。
では、果たして「ワクチンを接種しなかったら、感染症に罹患した」のでしょうか。
もしかすると、普段から外出頻度が少なく、感染リスクがそもそも小さかったのかもしれません。
あるいは、ワクチンを接種する前からその人はたまたま何らかの免疫を持っていたのかもしれません。
感染していたけれども症状が非常に軽く、感染していたことに気付かなかったのかもしれません。
因果関係を考えるためには、さまざまな可能性を考え、一つ一つの可能性を検証していく必要があります。
そのための様々な研究デザインがありますが、主なものを挙げてみましょう。
- ランダム化比較試験
- 操作変数法
- 回帰不連続デザイン
- 傾向スコアマッチング
- 差の差の分析法
それぞれどのような研究デザインなのかは別の機会にご紹介します。
まとめ
実社会ではランダム化比較試験の実施が、費用面や倫理面から困難なことがよくあります。
そのような場合、操作変数法、回帰不連続デザイン、傾向スコアマッチング、差の差の分析法などの手法が有用です。
日常的に集まるデータを活用する上で、さまざまな研究デザインがあることを知っておき、活用できないか思考を巡らせる癖をつけておきましょう。