バイアスって？研究に潜む「偏り」

Table of Contents

バイアスとは「偏り」

バイアスって言葉、日常生活でも何となく使われていますよね。

「それってバイアスかかってない？」など。

え？使ったことない？

そうですか。

便利ではありますが曖昧に使われがちですし、やたらと使わないのが賢明かもしれません。

バイアスは、日本語に直すなら「偏り」と近い意味になります。

疫学においてはバイアスは大きくわけて「選択バイアス」と「情報バイアス」の2種類があります。

順に見ていきましょう。

選択バイアス

選択バイアスは、その名の通り「選ぶ」あるいは「選ばれる」段階で発生するバイアス（偏り）です。

研究の計画段階で発生するもの

研究の計画段階で発生する選択バイアスとは、だいたいが目標に据えている母集団と、研究対象集団の代表性にずれがある場合です。

顕著な例でいうなら、「日本人の18～22歳の健康状態を知りたい」という目標を据えているのに、「都内の大学に通っている大学生を対象に調査する」ような場合です。

日本人の18～22歳のうち、都内の大学に通っている人達というのは、ごく一部に過ぎません。

その生活スタイルも、中学校や高校を卒業して就職した人達とは異なるでしょう。

もし「日本人の18～22歳の健康状態を知りたい」という大きな目標を掲げるのであれば、対象集団は「都内の大学に通っている大学生」のように偏った集団ではなく、幅広い層を調査対象とする必要があります。

研究の実施段階で発生するもの

研究の実施段階で発生する選択バイアスとは、研究に参加する人と研究に参加しない人、あるいは、研究を途中で止めた人と研究を完遂した人との間で、重大な違いがあるというものです。

仮に「都内の大学に通っている大学生の健康状態を知りたい」という研究で、「都内の大学に通っている大学生」全員にアンケート調査の参加依頼書＋アンケート用紙を配ったとしましょう。

まず、参加依頼書とアンケート用紙に記載して返送するという作業を行うか否か、という時点で偏りが出ます。

無報酬の依頼だった場合、「研究に貢献したい」「世の中の役に立ちたい」という思いの学生が回答に協力しやすいでしょう。

そのため、「アンケートなんてめんどくさい」「お金がもらえないなら回答しない」という学生の回答は得られません。

この偏りが、アンケート結果にどのような影響を及ぼすでしょうか。

「研究に貢献したい」「世の中の役に立ちたい」という思いを持つ学生に偏っている場合、健康状態も良い方向に偏った結果が出てくる可能性があります。

無報酬のアンケート調査に協力するような余裕のある学生だったり、まじめな学生に偏って回答が集まり、自暴自棄になっていたり、そもそもアンケートを回答する余裕のないほど大変な生活を送っている学生の声は集まらない、という具合です。

アンケート調査1つとっても奥が深いですね。

情報バイアス

研究に参加した後も、情報収集の段階でもバイアスが生じる可能性があります。

測定実施者が原因

測定機器

測定機器を用いる研究だったとしましょう。

もし測定機器を扱う人が複数人いて、その機器の扱いの習熟度に大きな差があったとしたらどうでしょう。

ベテランの人であれば測定機器の扱いに慣れている一方、初めてその測定機器を使うような場合、測定結果の精度にも差が出てくることが予想されます。

あるいは、習熟度は同じだったとしても、機器の扱いのクセのようなものが出てしまって、結果に影響する可能性もあります。

インタビュー

インタビューを実施して回答を集める研究ではどうでしょうか。

インタビューには相応の技術や経験が求められます。

測定機器の扱いと同様に、インタビュアーのクセや経験の差も影響する可能性があります。

測定対象者が原因

記憶

測定対象者が原因で起こり得るバイアスは、リコールバイアス（想起バイアス、思い出しバイアス）が有名でかつ重大なものです。

インタビューやアンケートをもとに情報を集める研究の場合、回答が得られないとそもそも研究になりません。

ですが、たとえば1週間前のランチに何をどの程度の量食べたか、すぐに思い出せるでしょうか？

その日が印象的な日であり、誰かと一緒に食べたとか、あなたの誕生日だったとか、いつもと違う特別な日だった場合、覚えているかもしれません。

このように、人の記憶というのは、濃淡があるものなのです。

リコールバイアスが発生しやすい典型例としては、「赤ちゃんの生まれた頃の状況について、ママに質問してみる」タイプの研究があります。

こうした研究の場合、得てして「赤ちゃんに何らかの異常が見られた場合」に、ママはかなり色々と調べたり記録したりしているので、事細かに情報が集まりそうです。

一方、赤ちゃんが特に何も問題なくスクスクと育った場合、もちろん日記や調べものなどはそうしたママもある程度はしているとは思いますが、前述のママほどではないでしょう。

そうすると、本来はどちらの赤ちゃんも鼻水が同程度に出ていたとしても、「赤ちゃんに何らかの異常が見られた場合」には記録・記憶されていて、「赤ちゃんに何らかの異常が見られなかった場合」には記録・記憶されていないという状況が起こり得ます。

そうすると、鼻水が原因で〇〇が起きたんじゃないか、といった誤った推測が発生してしまう恐れが出てくるわけです。

一方のママはただ覚えていなかった、記録していなかっただけだとしても、記録や記憶に頼る研究の場合はそうしたことが起きがちです。

測定方法が原因

「研究参加者に起きた〇〇というイベントを数える」と設定することはよくありますが、そもそも「研究参加者に、〇〇というイベントが起きた」というのはどう判断するのでしょうか。

例えば次のようにいくつかの定義が考えられますね。また、1つだけではなくて複数の条件を組み合わせる場合もあります。

電子カルテに「〇〇というイベントが起きた」と明記されている
患者さんの自己申告に基づく
検査値の情報をもとに「〇〇というイベントが起きた」とみなす
「〇〇というイベントが起きた」場合に行われる治療（処置や薬剤処方）の記録がある場合に、「〇〇というイベントが起きた」とみなす

いずれも一長一短があり完璧なものはありません。

過去の研究で用いられている手法を参考にしたり、計画中の研究に避ける時間や予算と相談しながら、どんな測定手法や定義を用いるかが大切です。

まとめ

研究を行う上でバイアス（偏り）を完全に排除することは不可能に近いでしょう。

悉皆データを使うといったビッグデータ時代ならではの解決方法も今後出てくるかもしれませんが、すべてのデータを使ったとしても定義などで偏りが生じる部分は残るかもしれません。

全てを一度に明らかにできる研究などないのですから、無理にバイアスを悪として排除しようとする必要もありません。

むしろ、その研究がどんな偏りを持っていて、どんな方向・角度から臨床上の疑問に答えているのか、という視点で解釈できるようにしておく方がよっぽど重要です。