疫学とは、明確に定義された人間集団を対象として、その中で生じる健康に関連する様々な事象の頻度や分布、そしてそれらに影響を及ぼす要因を明らかにする学問です 1。この学問の最終的な目的は、研究を通じて得られた知見を、集団が直面する健康問題の解決や予防策の立案に応用し、社会全体の健康水準を向上させることにあります 1。
個々の患者の診断と治療に焦点を当てる臨床医学とは対照的に、疫学は常に「集団」をその分析の単位とします 1。例えば、一人の患者が高血圧であると診断された場合、臨床医はその患者に最適な治療法を考えます。一方で疫学者は、ある地域や国といった集団全体で、どれくらいの人が高血圧であり、どのような人々が特になりやすく、その原因は何であるのかを探求します。このように、疫学は個人の健康問題の背景にある、より大きな社会全体の健康の姿を描き出すという役割を果たします。
「疫学」という言葉の起源は、かつて人類の大きな脅威であったコレラや天然痘といった感染症の流行、すなわち「疫病」の広がりを研究することにありました 4。事実、19世紀のロンドンでジョン・スノウが汚染された井戸水を突き止め、コレラの流行を終息に導いた研究は、疫学の輝かしい歴史の始まりを告げるものでした 5。しかし現代において、疫学が扱う対象は感染症に留まりません。がんや心臓病、糖尿病といった生活習慣病、さらには精神疾患や肥満、環境汚染物質への曝露に至るまで、人々の健康を脅かすあらゆる事象がその研究対象となっています 2。
この学問が公衆衛生の根幹をなす理由は、それが予防医学のための理論と方法論を提供するからです 1。疾病のリスク要因、例えば喫煙と肺がんの関連性を統計的に証明した研究は、その後の禁煙政策や健康教育の科学的根拠となり、多くの人々の命を救いました 5。疫学は、単に現象を記述するだけでなく、要因と結果の間の因果関係に迫り、その因果の連鎖を断ち切ることで疾病を予防するという、極めて実践的な目的を持っています 1。
したがって、疫学を学ぶことは、公衆衛生という分野を理解するための基本的な「文法」を習得することに他なりません。効果的な健康政策や予防介入は、直感や経験則だけでは成り立ちません。そこには必ず、集団のデータを科学的に分析し、客観的な根拠を導き出す疫学的な思考が存在します。これから続く各章では、この強力な科学的ツールを使いこなし、信頼性の高い知見を生み出すための研究デザインと分析手法について、少しずつ理解を進めていくことにしましょう。
Table of Contents
明確なリサーチクエスチョンの構築
優れた疫学研究は、漠然とした興味からではなく、明確に定義された一つの問いから始まります。この研究の出発点となる問いを「リサーチクエスチョン」と呼びます。力強いリサーチクエスチョンを構築するプロセスは、研究全体の成功を左右する最も重要な礎を築く作業であると言えるでしょう。
多くの場合、研究の着想は、医療や保健の現場で日々遭遇する素朴な疑問、すなわち「クリニカルクエスチョン」から生まれます 6。例えば、「この新しい治療法は、従来の治療法よりも本当に効果があるのだろうか」や「特定の生活習慣を持つ患者群では、なぜ特定の合併症が多いのだろうか」といった疑問です。しかし、これらのクリニカルクエスチョンは、そのままでは研究の問いとして用いるにはあまりにも曖昧です。研究を遂行するためには、この素朴な疑問を、客観的に答えを導き出せる形式、すなわち「リサーチクエスチョン」へと磨き上げる必要があります 7。
この磨き上げの過程で非常に有用なのが、PECOあるいはPICOと呼ばれる思考の枠組みです 6。これは、リサーチクエスチョンを構成するべき四つの重要な要素の頭文字を取ったものです。まず「P」はPatient(患者)またはPopulation(集団)を指し、どのような人々を研究の対象とするのかを明確にします。次に「E」はExposure(曝露)または「I」はIntervention(介入)で、研究の関心事である特定の要因や治療法を指します。「C」はComparison(比較)で、曝露や介入の効果を比較するための対照群、例えば従来の治療法や要因のない群を定義します。そして最後に「O」はOutcome(アウトカム)で、何を測定して効果を評価するのか、例えば疾病の発生や症状の改善などを具体的に定めます。
これらの要素を用いて構造化されたリサーチクエスチョンは、さらに「Well-defined」、すなわち十分に練り上げられている必要があります。Well-definedなリサーチクエスチョンとは、第一に、解釈の幅が生まれないほど具体的であること、第二に、利用可能なデータや手法を用いて理論的に回答が可能であること、そして第三に、その問いに答えることで、対象となる集団の健康を守るための具体的な行動につながるような、意義深い知識をもたらすものであることが求められます 9。例えば、「薬剤Aは肺がん患者の有害事象を減らすか」という問いは不明確です。これを「ステージⅢの新規肺がん患者(P)において、薬剤Aによる一次治療(E)は、従来の化学療法(C)と比較して、治療開始後1年以内の間質性肺炎の発生率(O)を低下させるか」と具体化することで、初めて検証可能なリサーチクエスチョンとなるのです。
最後に、この問いが研究として実行する価値があるかを判断するために、FINERという基準で最終確認を行います 6。FINERとは、Feasible(実行可能か)、Interesting(科学的に興味深いか)、Novel(新規性があるか)、Ethical(倫理的か)、Relevant(社会的に必要か)という五つの観点です。この最終関門を通過して初めて、リサーチクエスチョンは研究全体の設計図としての役割を果たす準備が整います。
このようにして構築されたリサーチクエスチョンは、単なる出発点ではありません。それは、研究の方向性を決定づける羅針盤であり、後の研究デザインの選択、対象集団の定義、アウトカムの測定方法、そして分析戦略に至るまで、研究のあらゆる側面を規定する設計図そのものなのです。この最初のステップで精度を欠けば、その後の全ての努力が方向性を見失いかねません。したがって、力強いリサーチクエスチョンの構築こそが、魅力的な疫学研究を実現するための、最も重要かつ創造的な第一歩と言えるでしょう。
対象集団を正確に定義する
リサーチクエスチョンが定まったなら、次に行うべきは、その問いに答えるための舞台、すなわち研究の対象となる人々の集団を正確に定義することです。疫学研究において、研究者が本当に知りたい対象と、実際にデータを収集し分析できる対象との間には、しばしば隔たりが存在します。この隔たりを正しく認識し、その影響を考察することが、研究結果の信頼性を担保する上で不可欠です。
まず理解すべきは、研究における対象集団が三つの異なるレベルで定義されるという点です 9。第一に、「ターゲットポピュレーション(目標母集団)」があります。これは、研究者が最終的に研究結果を適用し、一般化したいと考えている最も広範な人々の集団です。例えば、「日本全国の2型糖尿病患者」といったものがこれに当たります 9。
しかし、現実の研究では、この広大なターゲットポピュレーション全体を調査することは不可能です。そこで第二に、「スタディポピュレーション(研究対象集団)」が設定されます。これは、ターゲットポピュレーションの中から、特定の適格基準(Inclusion criteria)と除外基準(Exclusion criteria)を適用して絞り込まれた、理論的に研究への参加資格を持つ人々の集団です。例えば、年齢を40歳以上75歳未満に限定し、重篤な腎機能障害を持つ患者を除外する、といった基準が設けられます 9。
そして第三に、「アナリシス集団(解析対象集団)」が存在します。これは、スタディポピュレーションに属する人々のうち、研究への参加に同意し、途中で脱落することなく、最終的に分析に必要なデータがすべて揃っている人々の集団を指します 9。研究からの脱落やデータの欠損は避けられないため、通常、アナリシス集団はスタディポピュレーションよりも小さくなります。
これらの三つの集団の間に生じるズレこそが、「選択バイアス」という深刻な問題の温床となります。選択バイアスとは、研究対象として選ばれた人々が、本来のターゲットポピュレーションを代表していないことによって生じる、系統的な誤差のことです 11。これは偶然によるばらつきではなく、特定の方向への偏りであり、研究の結論を根本から歪めてしまう危険性をはらんでいます 12。
例えば、ある職場の労働者を対象に健康調査を行う場合、調査時点で病気のために休職していたり退職していたりする人々は、研究対象から除外されてしまいます。その結果、比較的健康な労働者ばかりが集団を構成することになり、その職場の労働者全体の健康状態を過大評価してしまう可能性があります。これは「健康労働者効果」として知られる典型的な選択バイアスです 13。また、研究への参加を呼びかけた際に、健康への関心が高い人ほど応じやすい傾向があれば、それも選択バイアスの一因となります。研究参加後の脱落も同様で、もし治療の副作用に耐えられなかった人々がより多く脱落した場合、残されたアナリシス集団における治療効果は、実際よりも高く見積もられてしまうでしょう 14。
選択バイアスがもたらす最も深刻な帰結は、研究の「外的妥当性」、すなわち研究結果をターゲットポピュレーションに一般化できる度合いを著しく損なうことです。アナリシス集団で得られた知見が、そもそも偏った人々から得られたものであるならば、その結果をより広い集団に適用することはできません。例えば、若く健康な被験者のみを対象とした新薬の臨床試験の結果を、持病を抱える高齢者にそのまま当てはめることが危険であるのは、この選択バイアスがもたらす外的妥当性の問題に他なりません。したがって、研究論文を読む際には、常に「この研究で実際に分析されたのはどのような人々で、自分が本当に知りたい人々とどれくらい違うのか」という批判的な視点を持つことが、結果を正しく解釈するための鍵となるのです。
測定:アウトカムの定義と尺度の選択
研究の対象集団が明確になったら、次はその集団において「何を」測定するのか、すなわちアウトカムを厳密に定義し、その測定尺度を適切に選択するという核心的なステップに進みます。アウトカムの定義が曖昧であったり、尺度の選択が不適切であったりすると、たとえ他のすべての手続きが完璧であっても、得られる結果は信頼性を欠き、解釈不能なものとなりかねません。
まず、アウトカムの定義は、単に疾病名を挙げるだけでは不十分です。例えば「心筋梗塞」をアウトカムとする場合でも、その診断がどのような基準に基づいているのかを明記しなければ、研究者や読者によって解釈の幅が生まれてしまいます。信頼性の高い研究では、心電図の特定の変化、血液中の酵素の基準値、特徴的な症状といった、客観的で再現可能な診断基準を具体的に示すことが求められます 9。これにより、誰が判断しても同じ結論に至るような、明確なアウトカム定義が確立され、異なる研究間での結果の比較も可能になります。アウトカム定義の特異性にこだわるのは、定義の仕方によって診断の感度や特異度が変わり、それに応じて研究結果として算出される発生頻度などの数値が大きく変動しうるからです 9。
次に、定義されたアウトカムをどのように数値として表現するか、すなわち「尺度」を選択することが重要です。疫学で頻繁に用いられる主要な尺度には、有病率、罹患率、そして累積罹患率があります。これらは似ているようでいて、それぞれが語る物語は大きく異なります。
「有病率(Prevalence)」は、ある特定の時点において、集団の中でその疾病を持つ人々の割合を示す尺度です 15。これは、ある瞬間の「スナップショット」のようなもので、「今、この病気はどれくらい蔓延しているのか?」という問いに答えます。有病率は、糖尿病や高血圧のように、長期間にわたって持続する慢性疾患の社会的な負荷(burden)の大きさを表現するのに適しています 17。
一方、「罹患率(Incidence rate)」は、一定の観察期間中に、集団の中で新たに疾病が発生する「速度」を示す尺度です 9。これは単なる割合ではなく、観察された人々の総時間(人年など)を分母に置くことで、時間の概念を含んでいます。「人々はどれくらいの速さでこの病気になっているのか?」という問いに答えるものであり、疾病発生のリスクの強さを動的に捉えることができます。
そして、「累積罹患率(Cumulative incidence)」は、疾病を持たない人々の集団が、特定の観察期間内(例えば5年間)にその疾病を発症する割合を示します 9。これは、その期間における個人の平均的なリスクを直接的に表現するもので、「今後5年間でこの病気になる確率はどれくらいか?」という問いに答えます。
これらの尺度選択は、単なる技術的な問題ではありません。それは、その健康問題の何を伝えたいのかという、研究の物語を方向づける戦略的な選択です。例えば、風邪のように罹病期間は短いが頻繁に発生する疾患の場合、ある一時点での有病率は低いかもしれませんが、1年間の累積罹患率は非常に高くなります。ここで有病率のみを報告すれば、その疾患が社会に与える影響を過小評価してしまうでしょう。逆に、管理された慢性疾患のように、有病率は高くても新規発生が少ない場合、罹患率だけを見れば問題の大きさを捉えきれません。したがって、研究者はリサーチクエスチョンの目的に沿って、最も的確に事象を表現できる尺度を慎重に選択しなければならないのです。
適切な研究デザインの選択
リサーチクエスチョンを確立し、対象集団とアウトカムを定義した後は、それらの問いに答えるための具体的な設計図、すなわち「研究デザイン」を選択する段階に入ります。疫学における研究デザインは多岐にわたりますが、それぞれに特有の長所と短所があり、因果関係の証明能力にも差があります。どのデザインを選択するかは、科学的な厳密性と、時間や費用といった現実的な制約との間のトレードオフを考慮した、戦略的な決定となります。
研究デザインは、まず大きく「記述的研究」と「分析的研究」に大別されます 2。記述的研究は、疾病の頻度や分布を人・場所・時間といった軸で記述することに主眼を置き、仮説の提示に貢献しますが、要因と疾病の関連性を検証するものではありません。一方、分析的研究は、特定の要因(曝露)と疾病(アウトカム)の関連性についての仮説を検証することを目的とします。ここでは、主要な分析的観察研究デザインを、その特徴とともに見ていきましょう。
最も基本的な分析的研究デザインの一つが「横断研究(Cross-sectional study)」です。このデザインでは、ある一時点において、集団における要因への曝露状況とアウトカムの有無を同時に調査します 18。短期間かつ低コストで実施できるという利点がありますが、曝露とアウトカムのどちらが先に起こったのかという時間的な前後関係を判断できないという致命的な弱点を抱えています。例えば、運動習慣のない人に肥満が多いという関連が見つかったとしても、運動不足が肥満の原因なのか、肥満の結果として運動しなくなったのかを、このデザインだけで結論づけることはできません。したがって、因果関係の証明能力は極めて低いと言えます。
この時間関係の問題に一つの解決策を与えるのが「症例対照研究(Case-control study)」です。このデザインは、まず疾病を持つ人々(症例群)と、持たない人々(対照群)を設定することから始まります。そして、両群の過去に遡り、関心のある要因への曝露状況を比較します 18。この方法は、アウトカムが発生してから調査を開始するため、発生頻度の稀な疾病の研究に適しており、比較的短時間で結果を得られるという効率性の高さが最大の利点です。しかし、過去の曝露状況を本人の記憶に頼る場合が多く、「思い出しバイアス(Recall bias)」、すなわち症例群のほうが曝露をより正確に、あるいは過剰に思い出す傾向があるという問題が生じやすい欠点があります。
観察研究の中で、因果関係を論じる上で最も強力な証拠を提供できるのが「コホート研究(Cohort study)」です。コホートとは、特定の共通特性を持つ人々の集団を意味します。このデザインでは、研究開始時点で疾病を持たない人々の集団(コホート)を設定し、要因への曝露の有無によってグループ分けします。そして、このコホートを未来に向かって長期間追跡し、各グループでどちらがより多く疾病を発生させるかを比較します 18。この研究の最大の強みは、要因への曝露が疾病発生よりも前に起きていることを明確に確認できる点にあります。この「時間的先行性」は、因果関係を推論するための必須条件です。しかし、その強力さの代償として、結果を得るまでに長い年月と莫大な費用を要し、稀な疾病の研究には非効率であるという大きな欠点を抱えています。
これらの研究デザインは、因果関係の証明能力という観点から、一種の「エビデンスの階層」を形成しています。横断研究から症例対照研究、そしてコホート研究へと進むにつれて、バイアスを制御し、因果関係の必須条件である時間的先行性を確立する能力が高まるため、エビデンスの強さも増していきます。研究者がどのデザインを選択するかは、リサーチクエスチョンの性質、利用可能なリソース、そして倫理的な配慮を総合的に勘案して決定されます。この選択こそが、研究の科学的価値を決定づける重要な岐路となるのです。
データから情報を引き出す:分析手法の選択と解釈
研究デザインに沿ってデータが収集された後、次はそのデータから意味のある結論を導き出すための統計解析の段階へと移行します。統計解析は、単なる数字の計算ではありません。それは、複雑に絡み合った要因の中から、関心のある特定の要因と健康アウトカムとの真の関係性を浮かび上がらせるための、論理的な探求プロセスです。この探求における最大の課題は、「交絡」と呼ばれる現象をいかにして乗り越えるかという点にあります。
まず、統計解析は「記述統計」と「推測統計」の二つに大別されます 19。記述統計は、収集されたデータそのものの特徴を要約し、分かりやすく記述する手法です。平均値や割合を計算したり、分布をグラフで示したりすることがこれに当たります。一方、推測統計は、手元にある標本(サンプル)データを用いて、その背後にあるより大きな母集団全体の性質を推測し、仮説の検証を行うための手法です 21。疫学研究で要因とアウトカムの関連性を評価する際に中心となるのは、この推測統計です。
推測統計を用いる上で避けて通れないのが、「交絡(Confounding)」という問題です。交絡とは、調べたい要因(曝露)とアウトカムの両方に関連し、両者の見かけ上の関連性を歪めてしまう第三の因子の存在を指します 22。古典的な例として、コーヒー飲用と心筋梗塞の関連が挙げられます。データ上、コーヒーを飲む人ほど心筋梗塞が多いという関連が見られたとしても、それはコーヒーが原因とは限りません。もし、コーヒーを飲む人々に喫煙者が多いという事実があれば、「喫煙」という交絡因子が、コーヒーと心筋梗塞の間に見かけ上の関連を生み出している可能性があるのです 22。この交絡因子の影響を取り除かなければ、誤った結論を導いてしまいます 13。
この交絡を統計的に制御するために用いられる最も強力なツールが、「回帰分析(Regression analysis)」です 24。回帰分析の目的は、アウトカムに影響を与えうる複数の変数(交絡因子など)の影響を同時に考慮しながら、関心のある曝露とアウトカムとの間の「独立した」関連の強さを推定することです。これにより、他の条件を一定にした場合に、曝露がアウトカムにどれだけの影響を与えるかを見積もることが可能になります。
使用される回帰モデルの種類は、アウトカムの性質によって異なります。アウトカムが「あり・なし」の二値(例えば、疾患の有無)である場合には、「ロジスティック回帰分析」が用いられます。この分析から得られる主要な指標が「オッズ比(Odds ratio)」であり、これは交絡因子を調整した後の曝露とアウトカムの関連の強さを示します 25。
一方、アウトカムが「イベントが発生するまでの時間」(例えば、診断から死亡までの期間)である場合には、「生存時間解析」が用いられます。その代表的な手法が「Cox比例ハザードモデル」です 28。このモデルは、交絡因子の影響を調整した上で、「ハザード比(Hazard ratio)」を推定します。ハザード比とは、ある瞬間におけるイベント発生のリスクが、曝露群と非曝露群で何倍異なるかを示す指標です 28。
これらの多変量解析手法は、観察研究における交絡という制約を乗り越えるための、いわば「統計的な仮想実験」と言えます。ランダム化によって全ての背景因子を均等にする実験とは異なり、観察研究では曝露群と非曝露群の背景は不均一です。回帰分析は、年齢や性別といった測定済みの交絡因子の影響を統計的に「調整」することで、あたかもそれらの因子が両群で等しいかのような状況を擬似的に作り出し、より公平な比較を可能にします。このプロセスを通じて、私たちは複雑な現実のデータの中から、より真実に近い関連性を慎重に読み解いていくのです。
優れた研究とは:成功のための原則と実践
これまでの章で詳述してきた、明確なリサーチクエスチョンの設定、適切な研究デザインの選択、そして厳密な分析手法の適用は、優れた疫学研究を構成する不可欠な要素です。しかし、現代の科学において、研究の質は手法の正しさだけで測られるものではありません。その研究プロセスがいかに透明であり、他の研究者によって検証可能であるかという「透明性(Transparency)」と「再現性(Reproducibility)」が、科学的信頼性の根幹をなす新たな基準として強く求められています 30。
この透明性を確保するための最も重要な実践の一つが、研究を開始する前にその計画書(プロトコル)を公的なデータベースに登録する「事前登録」です 32。日本では、大学病院医療情報ネットワーク(UMIN)が提供する臨床試験登録システム(UMIN-CTR)などがその役割を担っています 33。多くの主要な医学雑誌は、現在、事前登録されていない臨床研究の論文を受理しない方針を打ち出しており、これはもはや推奨ではなく必須の要件となりつつあります 31。
なぜ、これほどまでに事前登録が重要視されるのでしょうか。その最大の理由は、「出版バイアス(Publication bias)」という、科学の健全性を蝕む深刻な問題を抑制するためです 32。出版バイアスとは、研究者や雑誌編集者が、統計的に有意な「陽性(ポジティブ)」な結果が出た研究を、有意な差が見られなかった「陰性(ネガティブ)」な結果の研究よりも、優先的に出版してしまう傾向を指します。このバイアスが存在すると、世の中に公表される科学的知見は、成功例に大きく偏ってしまいます。その結果、効果のない治療法が繰り返し試されたり、ある治療法の本当のリスクが隠蔽されたりするなど、医学の進歩が歪められ、患者に不利益をもたらす危険性があります。
事前登録は、この問題に対する強力な対抗策となります。研究が開始される前に、その目的、対象、主要なアウトカム、分析計画が公開されることで、その研究が存在したという動かぬ証拠が残ります 32。これにより、たとえ研究者にとって都合の悪いネガティブな結果が出たとしても、その研究が「存在しなかった」ことにはできなくなります。他の研究者や政策決定者は、登録された全ての研究を検索し、そのうちどれだけの結果が公表されているかを確認することで、出版バイアスの存在を評価できるようになるのです 34。
このように、事前登録のような透明性を確保する取り組みは、単なる手続き上の煩雑な要件ではありません。それは、研究者個人の誠実さだけに頼るのではなく、科学のプロセス自体に、人間の認知的な偏りや功名心といったバイアスに対抗するための構造的な安全装置を組み込む試みです。研究計画と結果の分析を明確に分離することで、都合の良い結果だけを選んで報告する「チェリーピッキング」や、有意な結果が出るまで様々な分析を試す「p-ハッキング」といった、研究の信頼性を損なう行為を防ぎます。優れた研究の証とは、華々しい成果そのものではなく、その成果に至るまでのプロセスが、いかに誠実で、透明で、検証可能であるかにかかっているのです。
まとめと今後の疫学研究デザイン
本稿では、集団の健康を探求する科学である疫学の核心に迫るべく、その研究プロセスを段階的に解き明かしてきました。魅力的な疫学研究とは、明確なリサーチクエスチョンから始まり、対象集団とアウトカムの厳密な定義、目的に合致した研究デザインの選択、そして交絡を適切に制御した分析と慎重な解釈という、一連の論理的な連鎖の上に成り立つものであることを確認しました。これらの古典的とも言える原則は、今後も疫学研究の信頼性を支える不変の土台であり続けるでしょう。
しかし、その土台の上で、疫学は今、大きな変革の時代を迎えています。その原動力となっているのが、データサイエンスとの融合です。電子カルテ、ゲノム情報、さらにはスマートフォンやウェアラブルデバイスから得られる膨大な「医療ビッグデータ」の登場は、疫学研究に前例のない機会をもたらしています 35。これらの多様かつ大規模なデータを解析する強力なツールとして、人工知能(AI)や機械学習の技術が注目されています 37。AIを用いた画像診断支援による疾患の早期発見、ゲノム情報解析に基づく個別化医療の推進、リアルタイムデータに基づく感染症流行の予測など、その応用範囲は急速に拡大しています 35。
特に、日常の診療現場で得られる「リアルワールドデータ(RWD)」を分析して得られる「リアルワールドエビデンス(RWE)」は、従来の臨床試験を補完する新たな知見として重要性を増しています 36。管理された環境下で行われる臨床試験とは異なり、RWEは、多様な背景を持つ実際の患者集団において、治療法がどのように機能しているかを明らかにする可能性を秘めています。
一方で、この新たな地平には挑戦も伴います。リアルワールドデータは、元々研究目的で収集されたものではないため、情報が不完全であったり、形式が不統一であったりすることが多く、その利用には高度なデータクレンジング技術と統計学的な知識が不可欠です 36。また、AIモデルが導き出した結果が、単なる相関関係なのか、それとも真の因果関係を反映しているのかを慎重に見極めなければ、誤った医療判断につながる危険性もはらんでいます。
したがって、疫学の未来は、古典的な手法がデータサイエンスに取って代わられるのではなく、両者が融合する先にあります。バイアスや交絡といった疫学の基本原理を深く理解することの重要性は、扱うデータが巨大で複雑になるほど、むしろ増していくでしょう。これからの疫学研究者には、伝統的な研究デザインの知識に加え、ビッグデータを適切に扱い、AIの出力を批判的に吟味できる、分野横断的な能力が求められます 37。疫学の基本原則を保ちながら、データサイエンスという新たな技術やコンセプトを活用すること。それこそが、人々の健康と福祉の向上という目的に向けて、私たちをより良い未来へと導いてくれるに違いありません。
引用文献
- 疫学 (epidemiology) の定義 疫学の目的 疫学の目的 疫学は何の ..., http://minato.sip21c.org/publichealth/2019-02.pdf
- 疫学 - Wikipedia, https://ja.wikipedia.org/wiki/%E7%96%AB%E5%AD%A6
- 標準疫学 - World Health Organization (WHO), https://apps.who.int/iris/bitstream/handle/10665/43541/9241547073_jpn.pdf
- 【日本人の健康状態】公衆衛生の基礎としての疫学 ~自家製漬物が売り場から消える?, 【日本人の健康状態】公衆衛生の基礎としての疫学 ~自家製漬物が売り場から消える?
- 疫学用語の基礎知識 - 日本疫学会, https://jeaweb.jp/glossary/glossary001.html
- 目の前の患者からはじまる臨床研究 | 金原出版, https://www.kanehara-shuppan.co.jp/books/detail.html?isbn=9784307004930&no=4&pc_mode_set=1
- リサーチクエスチョンの作り方―クリニカルクエスチョンからリサーチクエスチョンへ (JOHNS 38巻6号) | 医書.jp, https://webview.isho.jp/journal/detail/abs/10.24479/ohns.0000000151
- 研究立ち上げから論文化に至るまでの 一連の流れに関する座談会 - 日本薬剤疫学会, https://www.jspe.jp/wp-content/uploads/2024/04/PD-1_%E6%B7%B1%E6%BE%A4%E4%BF%8A%E8%B2%B4.pdf
- 【保存版】魅力的な記述疫学研究をするための4つの秘訣 - 研究ハック, https://nothing-without-poison.com/epi36/
- 【論文の書き方ブログ】リサーチクエスチョンの意味と考える手順, https://ameblo.jp/ronbun-support/entry-12797982372.html
- nw.tohoku-epco.co.jp, 選択バイアス(選択の偏り) - 疫学研究
- 選択バイアス | 疫学用語の基礎知識, https://jeaweb.jp/glossary/glossary012.html
- 【資料編】エビデンスの見方 - 健康を決める力:ヘルスリテラシーを身につける, http://www.healthliteracy.jp/shinrai/post_3.html
- Untitled, http://jaee.umin.jp/REE/J/2_8.pdf
- 用語集検索(疫学) | 食品安全委員会 - 食の安全、を科学する, https://www.fsc.go.jp/yougoshu/kensaku_ekigaku.html
- がん統計に関するQ&A:[国立がん研究センター がん統計] - がん情報サービス, https://ganjoho.jp/reg_stat/statistics/qa_words/statistics_qa.html
- 「割合」と「比」と「率」-疫学では、死亡率は「率」だが、乳児死亡率は「率」ではない, https://www.nli-research.co.jp/report/detail/id=58299?site=nli
- PowerPoint プレゼンテーション - 日本疫学会, https://jeaweb.jp/files/about_epi_research/contest2015_2.pdf
- その分析、やり方あってる?記述統計と推測統計の違い - エクスチュア, その分析、やり方あってる?記述統計と推測統計の違い - エクスチュア株式会社ブログ
- 記述統計と推測統計の違い|有効な活用方法も徹底解説 - Technologist's magazine, https://technologist.high-five.careers/2022/08/22/post-7062/
- 記述統計と推測統計の違いを徹底解説!ビジネス活用のポイントとは?, https://blog.since2020.jp/glossary/escriptivestatistics-inferentialstatistics/
- 交絡バイアス 交絡因子 | 疫学用語の基礎知識, https://jeaweb.jp/glossary/glossary014.html
- 疫学研究によく起きる問題 | 電磁界情報センター, https://www.jeic-emf.jp/public/web_mag/explanation/1029.html
- 回帰分析 | 疫学用語の基礎知識, https://jeaweb.jp/glossary/glossary023.html
- 第15章:多変量解析 ロジスティック回帰分析 | 統計講義動画 - UMIN PLAZAサービス, https://plaza.umin.ac.jp/~health-stat/lecture/chapter15/
- 多変量解析:重回帰・ロジスティッ ク回帰・比例ハザードモデル - 和歌山県立医科大学附属病院 臨床研究センター, https://waidai-csc.jp/updata/2018/08/seminar-igaku-20171222.pdf
- ロジスティック回帰分析をわかりやすく!結果のオッズ比の見方・解釈・書き方も, https://best-biostatistics.com/correlation_regression/logistic.html
- Cox比例ハザードモデルをわかりやすく解説!生存時間解析での多変量解析! | いちばんやさしい, https://best-biostatistics.com/surviv/cox.html
- 【生存時間解析では理解必須!】比例ハザード性の考え方と比例ハザード性の確認方法を解説!, https://biostatistics-consult.com/proportional-hazards-assumption/
- 研究デザインとは?6種類の詳細分類や4つの要素などわかりやすく解説 - ワールドインテック, https://www.witc.co.jp/blog/cjvh1opqm/
- 医学研究報告の透明性確保ガイドライン6選 - エナゴ学術英語アカデミー, https://www.enago.jp/academy/6-widely-accepted-guidelines-for-medical-research/amp/
- 臨床試験登録の必要性 - UMIN臨床試験登録システム(UMIN-CTR), https://www.umin.ac.jp/ctr/CTR_Background.htm
- 臨床研究の事前登録について UMIN-CTR - 北里大学, https://www.kitasato-u.ac.jp/hokken-hp/chiken/REC/PDF/UMIN-CTR.pdf
- 国立病院医療情報ネットワーク(UMIN)を含む国内外における 試験結果公開システムの技術的水 - 厚生労働科学研究成果データベース, https://mhlw-grants.niph.go.jp/system/files/2017/171031/201706035A_upload/201706035A0008.pdf
- 医療ビッグデータとは? 活用事例や将来の展望を解説! - デジタル社会実現ラボ, https://www.digital-innovation.jp/blog/healthcare-big-data
- リアルワールドデータの解析を通じて社会に貢献する 医療データのクレンジングに挑戦する株式会社Yuimedi | インタビュー・コラム, https://www.link-j.org/interview/post-5529.html
- データサイエンスで病原体の変異と感染症の流行を予測する。機構シンポジウムを振り返って, https://sr.rois.ac.jp/article/sr/sp05.html
- ビッグデータとAIの関係性とは?活用事例も紹介 - 技研商事インターナショナル, https://www.giken.co.jp/column/bigdata_ai/