エビデンス全般

複雑なRWD研究を見える化!研究の再現性を高める「デザインダイアグラム」とは?

リアルワールドデータ(RWD)を活用した研究、特に電子カルテデータを用いた研究は複雑であり、文章だけの説明では研究デザインの詳細な理解が難しく、エラーが生じやすいという課題があります。

また、研究デザインの説明に用いられる専門用語が統一されておらず、不明瞭なコミュニケーションにつながることがあります。

近年、一部の研究では、コホート組入れ日や曝露などの各種運用上の定義が原著論文で完全または正確に報告されていないことが原因の一つとして、結果が再現されないことが報告されており、再現性への懸念が高まっています。

このような課題に対処するために開発されたのが「デザインダイアグラム」です。

デザインダイアグラムって何?

デザインダイアグラムは、研究デザインとデータの観測可能性の両方を視覚的に表現することで、読者に研究の詳細を直観的に伝える強力なコミュニケーションツールです。

デザインダイアグラムを描くだけでなく、デザイン上の各種設定項目の妥当性や観測可能性の問題を文章で詳述し、ダイアグラムと併せることにより、読者の正確な理解が促進され、結果としてデータベース研究の再現性と信頼性が向上することが期待されています。

このフレームワークは、リアルワールドエビデンス研究のプロトコルテンプレート(HARPER)や薬剤疫学研究の報告ガイドラインの中でも使用が推奨されています。

デザインダイアグラムの目的は?

デザインダイアグラムの主な目的は、以下の点を通じてリアルワールドエビデンス研究の再現性を高めることです。

  1. 研究デザインの詳細を明確に伝達する: 標準化された用語とグラフィカルな構成を用いることで、複雑な縦断研究デザインの詳細を読者に明確に伝えることができます。これは、文章だけでは理解が難しい運用上の定義などを直感的に可視化し、曖昧さを排除することを目指しています。
  2. 運用上の定義の不正確さ・不完全さに対処する: 研究の再現性が損なわれる原因の一つとして、コホート組入れ日や曝露などの重要な運用上の定義が十分に報告されないことが挙げられます。デザインダイアグラムは、これらの再現性に関わる重要な設定項目を包括的に組み込み、視覚的に表現することで、報告の不備を減らし、読者が正確な定義を理解できるよう支援します。
  3. データの観測可能性を可視化し、解釈の正確性を向上させる: 最新のデザインダイアグラムでは、研究に用いたデータの観測可能性も可視化する要素が追加されました。特に電子カルテデータのように、データソース外の出来事が捕捉できない場合など、データの不完全さをシンプルに表現します。これにより、読者は研究結果を評価する際に、データの限界や潜在的なバイアス(例:誤分類バイアス)をより正確に考慮できるようになり、研究の解釈の正確性が向上します。
  4. コミュニケーションを効率化する: 標準化された専門用語と視覚的な表現は、研究者間のコミュニケーションの効率化にも寄与します。

研究デザインを可視化することの重要性

皆さんご存じのように、日常的に収集されるレセプト、電子カルテ、患者レジストリなどのRWDからエビデンスを創出し、医療や薬事規制の意思決定に役立てることへの関心が高まっています。

これらのデータを用いた縦断研究のデザインは複雑であり、文章だけの説明では詳細な理解が難しく、エラーが生じやすいという課題があります。また、研究デザインの説明に用いられる専門用語が統一されておらず、不明瞭なコミュニケーションにつながっています。近年、一部の研究では結果が再現されないことが報告されており、その原因の一つとして、コホート組入れ日や曝露などの運用上の定義が原著論文で完全または正確に報告されていないことが挙げられています。

研究の妥当性を評価するためには、研究疑問、デザイン、そしてデータの三つ組を合わせて考慮する必要があるため、デザインだけではなくデータの特性も重要です。RWDを用いた研究では、研究者がデータの取得内容、時期、方法をコントロールできません。そのため、特定の研究の時間的文脈におけるデータの完全性と質を明確に伝えることが、方法論的な妥当性を評価する上で極めて重要です。

この課題に対処するために、縦断研究デザインを可視化するグラフィカルなフレームワークである「デザインダイアグラム」が開発され、広く受け入れられています。これは、標準化された用語とグラフィカルな構成を用いて、読者に研究デザインの詳細を明確に伝え、研究の再現性を向上させることを目的としています。

さらに、このフレームワークは、研究に適用されたソースデータの適切性を読者が評価できるように拡張されました。特に、医療機関由来の電子カルテデータ(EHR)と、データの継続性に限りがある他のレジストリデータや、加入期間が定義された保険請求データとの違いを捉えるために、データの種類と観測可能性のシンプルな可視化が追加されています。

データの観測可能性を可視化することの重要性

電子カルテデータを用いた研究においてデータの観測可能性を可視化することの重要性は以下の点にあります。

  • データの不完全性の明確化: 特に米国のような断片化された医療制度において、電子カルテデータソースは臨床情報の深さでは優れていますが、患者がインデックスとなるEHRシステム外の医師の診察を受けると、研究者にとって情報が失われるという問題があります。外部データとの連携がない医療機関由来のデータベースを用いた研究では、その医療機関以外で発生したデータは取得できません。このようなデータの観測の不完全さ(データの観測可能性の問題)は、読者に誤った印象を与える可能性があります。
  • 研究の解釈の正確性向上: 新しいデザインダイアグラムでは、データの観測可能性をシンプルに可視化することで、読者がより正確に研究を解釈することを可能にしました。提案されている方法では、データの観測可能時間帯を、連続線と濃い色で示す観測可能、破線と濃い色で示す部分的に観測可能、連続線と薄い色で示す観測不可能の3つのカテゴリで表現します。これにより、各種データタイプ(診断、処方、診療行為、検査値など)および各種二次アンカー(選択基準、除外基準、共変量の評価期間など)のデータの完全性を視覚的に伝えることができます。
  • バイアス評価の支援: データの観測可能性に問題があるデータベース研究では、曝露、アウトカム、共変量の誤分類の程度によっては、結果に深刻なバイアスが入り得ます。例えば、ベースライン評価期間を長く設定しても、観測可能性を示す線がない場合、インデックス入院前の健康イベントが測定可能であるかのような誤った印象を与える可能性があります。デザインをデータに適合させるためには、インデックス入院外では観測可能性が限られていることを認識し、入院日における入院時診断や処置に測定を絞るよう評価期間を変更する必要があるかもしれません。データの観測可能性を可視化することは、こうしたバイアスの可能性を評価する上で役立ちます。
  • 再現性と信頼性の向上: 研究デザインとデータの観測可能性の両方を可視化することにより、読者に研究の詳細を直観的に伝える強力なコミュニケーションツールとなります。デザインダイアグラムを描くだけでなく、デザイン上の各種設定項目の妥当性や観測可能性の問題を文章で詳述し、ダイアグラムと併せることにより、読者の正確な理解が促進され、結果としてデータベース研究の再現性と信頼性が向上することが期待されます。

電子カルテデータを用いた研究における研究デザインとデータの観測可能性の可視化は、RWD研究の複雑さ、データの不完全性、およびそれに起因するバイアスの可能性を読者に明確に伝える上で不可欠です。これにより、研究の透明性、解釈の正確性、そして最終的には再現性と信頼性が向上します。

この可視化フレームワークは、リアルワールドエビデンス研究のプロトコルテンプレート(HARPER)や薬剤疫学研究の報告ガイドラインの中でも使用が推奨されており、今後さらに普及することが予想されます。

デザインダイアグラムの3つの時点アンカー

時点アンカー」という言葉を聞いたことはありますか?

アンカー、すなわち錨(いかり)ですから、何らかの目印、ブレないような重し、とでも思っていただければだいたいあっています。

データベース研究で目にする「index date」などが、時点アンカーの一例ですね。

リアルワールドデータを用いた研究デザインの再現性を高めるためのデザインダイアグラムにおいて、研究デザインの可視化は3つの「時点アンカー」(temporal anchor)を基軸として行われます。

これらのアンカーは、研究デザインの重要な時間的な要素を定義し、明確に伝えるために使用されます。

その3つの時点アンカーは以下の通りです。

ベースアンカー (Base Anchor)

暦時間(カレンダー上の時間)に基づいて定義されます。

主にデータソース全体や研究に利用可能なデータの時間範囲を記述するために使用されます。

具体的には、データが動的なデータベースから抽出された「データ抽出日」や、研究対象集団を作成するために利用可能なデータソースがカバーする「データソースの範囲」、解析用データセットを作成するために使用した「研究対象期間」などが含まれます。

一次アンカー (First-Order Anchor)

患者ごとに固有の時間で定義され、暦時間ではありません。

研究への組み入れ日や特定の指標日として設定され、研究対象集団が研究に組み入れられる時点や、アウトカムイベントが発生した時点など、研究の起点となる重要なタイミングを示します。

例えば、コホート研究や自己対照ケースシリーズ研究のような「曝露が起点になる研究デザイン」ではコホート組入れ日が、ケース・コントロール研究やケース・クロスオーバー研究のような「アウトカムが起点になる研究デザイン」ではアウトカムイベント発生日が一次アンカーになります。

デザインダイアグラムでは垂直の矢線で表現されます。

二次アンカー (Second-Order Anchor)

患者ごとに固有の時間で定義され、一次アンカーに対して相対的な期間として定義されます。

研究デザインにおける様々な評価期間やウォッシュアウト期間を設定するために使用されます。

具体的には、「曝露のウォッシュアウト期間」、「アウトカムのウォッシュアウト期間」、「除外基準の評価期間」、「共変量の評価期間(ベースライン期間とも呼ばれます)」、「曝露の評価期間」、「追跡期間」などがあります。選択基準の評価期間も二次アンカーに加えられることがあります。

デザインダイアグラムでは個別のボックスで表現され、設定項目ごとに別の行に配置されます。これは、抽出されたデータセットから研究対象集団を構成する操作順序を反映しています。

新規使用者デザインで推奨される曝露のウォッシュアウト期間

電子カルテデータなどのリアルワールドデータを用いた新規使用者デザイン(new user design)の研究において推奨される曝露のウォッシュアウト期間についてご説明します。

新規使用者デザインでは、研究対象期間の開始時点で初めて注目する曝露(および/または比較対照の曝露)が開始された患者である新規使用者(new user)を研究に組み入れます。これを定義するために、コホート組入れ日(患者が研究対象集団に組み入れられる日)より前の一定期間である曝露のウォッシュアウト期間(exposure washout window)が設定されます。このウォッシュアウト期間内に注目する曝露(および/または比較対照の曝露)の記録がない場合、コホート組入れ日に開始される曝露は「新規(new)」の開始とみなされます。

新規使用者デザインは、すでに曝露されている患者(既使用者 prevalent user)を研究に組み入れる場合に生じうる選択バイアス(Depletion-of-susceptibles bias)を避けるための標準的な方法とされています。

インフルエンザワクチンに焦点を当てた論文がありますので、具体例をもとに理解を深めたい際にはご一読をお勧めします。

Epidemiol Infect. 2019 Nov 27:147:e306. doi: 10.1017/S0950268819001961.

Depletion-of-susceptibles bias in influenza vaccine waning studies: how to ensure robust results

https://pubmed.ncbi.nlm.nih.gov/31774051/

ウォッシュアウト期間の長さについては、一般的に6カ月や1年を設定することが多いとされます。しかし、評価される薬剤の種類やクラスによっては、さらに長い期間が求められる場合もあります。新規使用者デザインにおけるウォッシュアウト期間の再検討として、6~12ヶ月では不十分である可能性もあるでしょう。

ウォッシュアウト期間を長く設定すると、患者が真に新規使用者である可能性は高まりますが、その一方で、当該期間を確保できない患者は解析から除外され、サンプルサイズが減少するというトレードオフが存在します。したがって、ウォッシュアウト期間の具体的な長さは、研究対象とする薬剤の性質や使用するデータベースの特性を考慮して慎重に設定する必要があります。

まとめ

リアルワールドデータ(RWD)、特に電子カルテを用いた研究は複雑で、文章だけでは研究デザインの理解が難しく、再現性に課題がありました。専門用語の不統一や運用上の定義の不明瞭さも問題です。

この課題解決のため、研究デザインとデータの観測可能性を視覚的に表現する「デザインダイアグラム」が開発されました。これは、標準化された用語と図を用いて、コホート組入れ日や曝露定義といった運用上の詳細や、データの不完全性(観測可能性)などを明確に伝え、研究の透明性、解釈の正確性、再現性、信頼性を高めることを目的とします。

デザインダイアグラムは、ベース、一次、二次という3つの「時点アンカー」を基軸に構成され、新規使用者デザインにおける曝露ウォッシュアウト期間などの重要な設定も具体的に示します。このフレームワークはHARPER等のガイドラインでも推奨されており、RWD研究の質向上に貢献します。

これからRWDを用いた研究を計画される際には、ぜひともデザインダイアグラムのフレームワークを活用して、研究デザインの可視化に挑戦してみてください。

-エビデンス全般

© 2025 RWE