ICH-E9 臨床試験のための統計的原則 III. 試験計画上で考慮すべきこと

Table of Contents

III. 試験計画上で考慮すべきこと

3.1 試験計画の構成

3.1.1 並行群間比較計画

検証的試験で最もよく用いられる試験計画は並行群間比較計画である。被験者はそれぞれ異なる試験治療が割り当てられている二つ以上の群の一つにランダムに割付けられる。これらの試験治療は、一つ又は複数の用量の被験薬を含み、プラセボ若しくは実薬など一つ又は複数の対照治療も含むものであろう。並行群間比較計画の基礎となる仮定は、他のほとんどの計画における仮定に比べ複雑ではない。しかし、他の計画と同様に試験の解析と解釈を複雑にする別な側面（例えば、共変量、経時的繰り返し測定、要因間の交互作用、治験実施計画書違反、脱落（用語集参照）及び試験治療の中止）が存在することがある。

3.1.2 クロスオーバー計画

クロスオーバー計画では、各被験者は二つ又はそれ以上の試験治療を行う順序をランダムに割付けられる。したがって被験者自身を対照として試験治療比較が行われることになる。この単純な計画上の工夫は、主として、それを行うことが、定められた検出力の達成に必要な被験者数と通常は評価件数を劇的に減少させることがあるという理由から魅力的である。最も単純な2×2クロスオーバー計画では、各被験者は、多くの場合ウオッシュアウト期間をはさんで連続した二つの試験治療期間に、二種の試験治療のそれぞれをランダム化された順番で受ける。この計画の最も一般的な拡張では、n（>2）個の試験治療をn期間で各被験者がすべて受け、試験治療を比較することになる。計画の拡張には、各被験者がn（>2）個の試験治療の一部だけを受ける、同じ試験治療を繰り返し行う、といった様々な変法が存在する。

クロスオーバー計画は、結果の妥当性を損なうおそれのある多くの問題を抱えている。最大の問題は持ち越し効果に関するものである。持ち越し効果とは、先行する試験治療が次に続く試験治療期間において及ぼす残存効果である。加法モデルでは、不均等な持ち越し効果が試験治療の直接の比較を偏らせる。2×2クロスオーバー計画では、持ち越し効果が試験治療と時期間の交互作用から統計的に分離できず、どちらの効果の検定も対応する対比が「被験者間」であるため検出力に欠ける。この問題は、試験治療の数が多い、より高次の計画ではそれほど深刻なものではないが、完全に排除することはできない。

したがって、クロスオーバー計画を用いる場合は、持ち越し効果を回避することが重要である。このためには、疾患の領域及び新しい薬剤の双方に関する十分な知識に基づき、クロスオーバー計画を選択的かつ慎重に使用することが最善の結果を生むことになる。対象とする疾患は慢性的で症状が安定しているべきである。薬剤に関連のある効果はその試験治療期間中に完全に現れなければならない。ウオッシュアウト期間は薬剤効果が完全に消失するよう十分長くすべきである。これらの条件が満たされていると考えてよいかについて、試験に先だって事前情報及びデータから確認しておくべきである。

クロスオーバー試験には、他にも注意を払わなければならない問題がある。その中で最も注意すべきことは、被験者の減失に起因する解析と解釈の複雑さである。また、持ち越し効果が存在する可能性があることから、後続の試験治療期間に発生した有害事象に対応した試験治療がどちらであるか特定することは困難である。ICH E4には、これらの問題と共に、他の問題も含め記述されている。クロスオーバー計画は、一般に試験からの被験者の減失が少ないと期待できる場合に限定すべきである。

2×2クロスオーバー計画が一般的に使用されており、通常その妥当性が満たされているのは、同一薬剤の異なる二つの剤型間で生物学的同等性を示す場合である。特にこの健康志願者への適用の場合、二つの投与期間の間のウオッシュアウト時間が十分長ければ、持ち越し効果が、それに関連のある薬物動態変数に関して、発生することはほとんど考えられない。しかし、得られたデータに基づいて、例えば各治験薬の投与開始時に薬物が検出できなかったことを示すことによって、解析時にこの仮定をチェックすることはやはり重要である。

3.1.3 要因計画

要因計画は、複数の試験治療の異なる組み合わせを複数用いて、二つ以上の試験治療を同時に評価するものである。最も単純な例は、2×2要因計画である。被験者は二つの試験治療で可能な四つの組み合わせの一つにランダムに割付けられる。その四つとは、試験治療をA, Bとすると、「A単独」、「B単独」、「AB同時」、「どちらもなし」である。多くの場合、要因計画はAとBの交互作用を調べるという特定の目的のために用いられる。主効果の検定に基づいて必要な被験者数が計算されている場合には、交互作用の統計的検定はその検出力に欠けるであろう。要因計画がAとBの併用効果を調べるために用いられる場合、特に二つの試験治療が併用される見込みのある場合、この配慮は重要である。

要因計画の別の重要な利用法は、試験治療CとDを同時に使用する場合の用量-反応特性を立証することである。それは特に、先行する試験から、それぞれ単剤での有効性がある用量において立証されている場合である。Cについて、通常ゼロ用量（プラセボ）を含んだmの用量が選択され、Dについてもそれに近い数であるnの用量が選択される。全ての組み合わせを含んだ計画はm×n個の試験治療グループからなり、各グループはCとDの異なる用量の組み合わせのうちの一つを受ける。このようにして得られた反応曲面を用いることが、臨床適用のために適切な、CとDの用量の組み合わせを同定するのに役立つ場合がある（ICH E4参照）。

2×2要因計画は、一方の試験治療の有効性を評価するための被験者数で両方の試験治療の有効性を評価することにより、臨床試験の被験者を効率よく利用するために用いられる場合がある。この戦略は、死亡に関する大規模試験で特に有益であることが示されている。この方法の効率と妥当性は、試験治療AとBとの間に交互作用がないことに依存している。交互作用がなければ、主たる有効性変数に関するAとBの効果は加法モデルに従い、このためA単独の効果とBの効果に上乗せされたAの効果はほとんど等しくなる。クロスオーバー試験と同様に、この条件が満たされていると考えてよいことを示す根拠は、試験に先だって事前情報及びデータから確認しておくべきである。

3.2 多施設共同治験

多施設共同治験が実施されることには、主として二つの理由がある。第一の理由は、多施設共同治験が、新医薬品の有効性をより効率よく評価するための方法として認められていることである。場合によっては多施設共同治験が、妥当と考え得る範囲の期間内に試験の目的を満たすための十分な被験者を登録する唯一の実用的な手段となることがある。このような特徴を持つ多施設共同治験は、原則として、臨床開発のあらゆる段階で実施してよい。多施設共同治験は、施設当たりの被験者数が多い数カ所の施設において行う場合があり、まれな疾患の試験の場合は施設当たりの被験者数が少ない多数の施設において行うこともある。

多施設（かつ多治験責任医師）共同治験が計画される第二の理由は、得られた結果を一般化するためのより適切な根拠を与えるためであろう。第二の理由は、多施設共同治験がより広い患者集団から被験者を募集できる可能性があること、及び臨床の広い範囲の現場でこの医薬品が使用される可能性があることに基づいている。したがって、多施設共同治験は、将来使用される状況により近い実験状況を提供するものである。この場合、多数の治験責任医師が参加することは、医薬品の有益性に関して広範囲にわたる臨床的判断がなされる可能性をも生み出すことになる。一般化を目的とした多施設共同治験は、医薬品開発の後期の相での検証的試験となり、多数の治験責任医師と施設が参加することになる。一般化可能性（用語集参照）を更に高めるために、多施設共同治験が複数の異なる国にまたがって実施されることもあり得る。

多施設共同治験の結果の意味が十分に解釈され、外挿されるためには、治験実施計画書を実行する方法は明確で、すべての施設で同様のものであるべきである。更に、通常行われる必要な被験者数と検出力の計算は、施設が異なる場合でも比較する試験治療間の差の大きさは同じであるという仮定に依存している。このような背景を考慮して、共通の治験実施計画書を作成し、以下のように多施設共同治験を実施することが重要である。実施手順はできるかぎり徹底して標準化すべきである。評価基準及び評価体系のばらつきは、治験責任医師会議、試験前に行う関係者の訓練、試験実施中の慎重なモニタリングを通して小さくすることができる。適切な計画を立てるためには、一般に施設内で試験治療毎に被験者の分布が同じになるよう心掛けるべきであり、適切な運営管理により、この計画の目的を維持すべきである。後に施設間での試験治療効果の不均一性を考慮する必要性が判明した場合には、施設当たりの被験者数が過度に異なることがないようにしている試験及び極端に小規模な施設を含まない試験が有利である。それは、施設毎の重みを変えた場合でも、試験治療効果の重み付き推定値がそれほど異ならないからである。（この点は、すべての施設が小規模で、施設の特徴が解析には現れない多施設共同治験には当てはまらない。）これらの予防策を採用しないことは、結果の均一性が疑わしいことと併せると、深刻な場合には承認に関わる治験依頼者の主張に対して説得力のある根拠を示すものとは見なせない程度まで多施設共同治験の価値を減じるおそれがある。

最も単純な状況の多施設共同治験では、個々の治験責任医師が一つの病院で募集された被験者に対し責任をもつため、「施設」は治験責任医師又は病院に対して一つに特定される。しかし、多くの場合、状況はもっと複雑である。恐らく一人の治験責任医師が数カ所の病院で被験者を募集するということもあり、一人の治験責任医師が、一つ又は複数の関連病院における自身の診察室で被験者を募集する臨床家（治験分担医師）のチームの代表であることもある。統計モデルにおける施設の定義に疑問の余地がある場合、治験実施計画書の統計の部（5.1節参照）には、その多施設共同治験の枠組みにおける施設という用語の定義を明確にすべきである（例えば、治験責任医師毎なのか、場所なのか、又は地域なのか）。ほとんどの場合、施設は治験責任医師により定義することが十分可能で、ICH E6はこれに関連した指針を示している。施設の定義が疑わしい場合には、主要変数の測定及び試験治療に影響を与える重要な要因が施設内で均一になるように施設を定義すべきである。解析の際に施設を併合するためのルールはすべて、可能な限り前もって治験実施計画書中にその正当性も含めて記述すべきである。しかしどのような場合でも、とるべき手段に関する決定は、常に試験治療について盲検下で、例えば盲検下レヴューの際に行うべきである。

試験治療の効果の推定と検定に用いる統計モデルは治験実施計画書に記載すべきである。試験治療の主効果は、最初に施設と試験治療の交互作用を含まず施設間差を考慮に入れるモデルを用いて調べることができる。モデルに常に交互作用を含めると、試験治療の効果が施設間で均一な場合、主効果の検定の効率が低下する。試験治療効果の不均一性が真に存在する場合には、主効果の解釈には様々な議論がある。

例えば死亡を評価する大規模試験で施設当たりの被験者数が少ない試験にみられる例として、施設が臨床的に重要な影響を反映するとは考えにくいために施設が主要変数又は副次変数に影響を与えると考える理由はないといって差し支えないような場合がある。別の試験では、施設当たりの被験者数が少ないために、統計モデルに施設の効果を含めることが実行不可能であることが、あらかじめ認識できる場合もある。それらの場合、モデルに施設の項を含めることは適切ではなく、施設で層別したランダム化を行うことも必ずしも必要ではない。

施設当たりの被験者数が不均一性を評価しうる規模の試験で、試験治療の肯定的な効果が判明した場合、結論の一般化可能性に影響する可能性があるため、通常は施設間における試験治療効果の不均一性を探索すべきである。著しい不均一性は、個々の施設の結果を図示すること又は試験治療と施設間の交互作用の有意性検定などの解析手法によることでも確認される場合がある。交互作用の統計的有意性検定を用いる場合、試験治療の主効果を検出することを目的に計画した試験では、一般に交互作用の検定の検出力は低いことを認識しておくことが重要である。

試験治療効果の不均一性がみられた場合、その解釈には注意すべきであり、試験の運営管理面又は被験者の特徴といったそれとは別の面から説明できるかどうかを、積極的に調べるべきである。通常はその説明によって、適切な追加解析と解釈が示唆される。説明ができない場合、例えば著しい量的交互作用（用語集参照）から試験治療効果の不均一性の存在が明らかとなることは、施設に異なる重みを与えて試験治療効果の推定値を複数求め、試験治療効果の推定値の安定性を実証する必要があることを意味する。不均一性が著しい質的交互作用（用語集参照）により特徴付けられるものであれば、その理由を解明することは更に重要であり、説明ができない場合は、試験治療効果を確実に予測するために、追加の臨床試験を必要とするであろう。

これまで、多施設共同治験に関する議論は、固定効果モデルを用いることを前提としてきた。混合モデルも試験治療効果の不均一性を探索するために利用できる。混合モデルでは、施設及び試験治療と施設の交互作用を変量効果として扱っており、特に施設数が多い場合に用いることが適切である。

3.3 比較の型式

3.3.1 優越性を示すための試験

科学的には、有効性を立証するには、プラセボ対照試験でプラセボに優ることを示すこと、実対照薬に優ることを示すこと又は用量-反応関係を示すことが最も説得力がある。この型式の試験を「優越性」試験（用語集参照）と呼ぶこととする。本ガイドラインでは、特に断らない限り優越性試験を前提としている。

重篤な疾患に対して優越性試験により有効であることが示されている治療法が存在する場合、プラセボ対照試験は非倫理的と考えられることがある。その場合、実治療を対照として科学的に正しく用いることを考慮すべきである。プラセボ対照と実薬対照のどちらが適切であるかは、個々の試験ごとに判断すべきである。

3.3.2 同等性又は非劣性を示すための試験

優越性を示す目的以外にも、被験薬と標準治療とが比較される場合がある。この型式の試験は目的に応じて二つの主要なカテゴリに分けられる。一つは「同等性」試験（用語集参照）で、もう一つは「非劣性」試験（用語集参照）である。

生物学的同等性試験は前者のカテゴリに属している。また、例えば化合物が吸収されずそのために血中に現れない場合に、後発医薬品と先発医薬品との臨床的同等性を示すといった規制側の理由から、臨床的同等性試験が要求されることがある。

多くの実薬対照試験は、被験薬の有効性が実対照薬の有効性よりも劣らないことを示すために計画され、したがって後者のカテゴリに属している。実薬対照試験のもう一つの例は、被験薬の複数の用量と標準薬の推奨用量又は複数の用量が比較される試験である。被験薬の用量-反応関係を示すこと及び被験薬と実対照薬とを比較することを同時に行うことがこの試験計画の目的である。

実薬対照同等性試験又は非劣性試験には、プラセボを組み込んでもよく、そうすることで一つの試験で複数の目標を達成できる。例えば、プラセボに対する優越性の立証とその結果として試験計画の妥当性を確認できると同時に、実対照薬に対する有効性及び安全性がどの程度類似しているかについても評価できる。プラセボを含まない又は被験薬の複数用量を用いない実薬対照同等性試験（又は非劣性試験）には、よく知られた問題点がある。

その問題点とは、（優越性試験とは対照的に）内部妥当性を示すいかなる指標も必然的に存在していないことであり、このため外部情報による妥当性の確認を必要とする。同等性試験（又は非劣性試験）は本質的に保守的でないため、試験の計画上又は実施上の多くの不備が、同等であると結論づける方向へ結果を偏らせる傾向がある。これらの理由から、このような試験ではその計画上の特徴に特に注意すべきであり、慎重に実施する必要がある。例えば、登録基準違反、服薬不遵守、試験治療の中止、追跡不能、欠測データ及び治験実施計画書からのその他の逸脱を最小限に抑えることは特に重要であり、またこれらが解析に与える影響も抑えることが重要である。

実対照薬は慎重に選択すべきである。適切な実対照薬の例としては、広く使用されている治療法で、十分に計画され記録されている一つ以上の優越性試験によって適切な適応に対する有効性が明確に立証され定量的に示されており、現在計画している実薬対照試験においても同様の有効性を示すことが十分に期待できるものがあげられる。このためには、新たに行う試験に関連した、医学又は統計学の進歩を考慮した上で、新たに行う治験計画上の重要な特徴（主要変数、実対照薬の用量、適格基準など）を、実対照薬が臨床的に適切な有効性を明確に示した過去の優越性試験と同じにすべきである。

同等性又は非劣性を証明するために計画された試験では治験実施計画書に同等性又は非劣性を示すために計画されたということを明確に述べることが不可欠である。治験実施計画書には同等限界を明示しておくべきである。同等限界とは、臨床的に許容できると判断しうる最大の差であり、実対照薬の有効性を立証した優越性試験において観測された差よりも小さいものであるべきである。実薬対照同等性試験では、上側及び下側両方の同等限界が必要であり、実薬対照非劣性試験では下側同等限界のみが必要である。同等限界の大きさの選択には、十分な臨床的根拠を示すべきである。

統計解析は、通常信頼区間に基づいて行われる（5.5節参照）。同等性試験では、両側信頼区間を用いるべきである。信頼区間全体が同等限界内に含まれる場合、同等であると推論する。両側信頼区間の使用は、試験治療の差は同等限界の外側にあるという（複合）帰無仮説に対し、試験治療の差は同等限界の内側にあるという（複合）対立仮説を検定する、二つの片側検定を同時に行う方法と実際上同じものである。二つの帰無仮説には重なりがないため、第一種の過誤は適切に制御される。非劣性試験では、片側信頼区間を用いるべきである。信頼区間を用いた方法は、（被験薬から対照を引いた）試験治療間の差は下側同等限界に等しいという帰無仮説に対して、試験治療間の差は下側同等限界よりも大きいという対立仮説を検定する片側仮説検定に対応する。第一種の過誤の大きさの選択は、片側検定又は両側検定のどちらを選択するかとは別に検討すべきである。被験者数の計算は、これらの方法に基づくべきである（3.5節参照）。

被験薬と実対照薬に差がないという帰無仮説の検定結果が有意でないことから、同等性又は非劣性が示されたと結論することは不適切である。

解析対象集団の選択にも特別な問題が生じる。試験治療グループ又は対照治療グループにおいて、試験治療を中止した被験者又はそれらのグループから脱落した被験者は、効果が現れにくいことから、最大の解析対象集団（用語集参照）を用いた結果は同等性を示す方向に偏るおそれがある（5.2.3節参照）。

3.3.3 用量-反応関係を示すための試験

被験薬がどのような用量-反応関係を示すかは、開発のすべての相から、様々な方法によって解答が得られる可能性がある問題である（ICH E4 参照）。用量-反応試験は多くの目的に役立つであろう。中でも次に示すものは特に重要である。有効性の確認、用量-反応曲線の形状と位置の研究、適切な開始用量の推定、個人毎の用量の調整に最適な戦略の同定、それ以上臨床上の利益を見込むことができない最大用量の決定。プラセボ（ゼロ用量）を含めることが適切な場合にはプラセボを含め、多くの用量について集められたデータを用いて、これらの目的に対応する必要がある。そのためには、用量-反応関係の推定に信頼区間の構成及びグラフ表示を用いた手法を適用することが、統計的検定を使用することと同程度に重要である。仮説検定を用いる場合は、用量の順序関係又は用量-反応曲線の形状に関する個々の問題（例えば単調性）に対応した方法を用いる必要があろう。予定している統計的な手続きに関する内容の詳細は、治験実施計画書に述べるべきである。

3.4 逐次群計画

逐次群(群逐次)計画は、中間解析（4.5節及び用語集参照）を実施するために用いられる。

中間解析を可能にする計画がいくつかある中で、逐次群計画が受け入れ可能な唯一の型式というわけではないが最もよく適用されている。なぜならば、被験者の結果を試験期間中定期的にまとめて評価することは、個々の被験者の結果が利用可能になる都度評価するよりも実際的だからである。逐次群計画での統計手法は、試験治療の結果及び試験治療の割付に関する情報が利用可能となる（盲検解除、4.5節参照）前に、完全に明記しておくべきである。独立データモニタリング委員会(効果安全性評価委員会)（用語集参照）は、逐次群計画から得られるデータの中間解析の実施又は検討のために利用される（4.6節参照）。

逐次群計画は、死亡又は重大な非致死性の評価項目を調べる大規模で長期にわたる試験で広く用いられ成功してきたが、その他の状況でも利用されることが増えてきている。特にすべての試験で安全性をモニターしなければならないことは共通の認識となっていることから、安全性の理由から早期中止を行うことも含めて正式な手続きの必要性を常に検討しておくべきである。

3.5 必要な被験者数

臨床試験の被験者数は、提示された問題に信頼のおける解答を与えられるよう常に十分多くすべきである。試験に必要な被験者数は、通常試験の主要な目的により決められる。

被験者数がその他の理由から決定される場合には、その理由を明確にし正当化しておくべきである。例えば、安全性に関する問題若しくは要求に基づいた試験又は重要な副次目的に基づいて被験者数が決定される試験では、主要な有効性の問題に基づいて被験者数が決定される試験よりも多くの被験者数を必要とするであろう（例えば、ICH E1A 参照）。

適切な被験者数を決定するために用いられる通常の方法を利用するためには、以下の項目を定めておくことが必要である。それらは、主要変数、検定統計量、帰無仮説、選択された用量での対立（「作業」）仮説（その用量と選ばれた対象集団で検出すべき又は棄却すべき試験治療の差を考慮することも含めて）、誤って帰無仮説を棄却する確率（第一種の過誤）及び誤って帰無仮説を棄却できない確率（第二種の過誤）であり、更に試験治療を中止した被験者及び治験実施計画書違反を取り扱う方法も定める必要がある。検出力の評価のために、イベント発生率が主要な関心事項となる場合には、試験に必要なイベント数から最終的な被験者数を外挿するための仮定も置くべきである。

被験者数を計算する方法は、計算に用いる見積値（分散、平均値、反応割合、イベント発生率、検出すべき差）とともに、治験実施計画書に定めておくべきである。また、これらの見積値の根拠も示すべきである。これらの仮定からの様々なずれに対して、必要な被験者数がどの程度変わり易いか調べることは重要であり、このためには実際に起こりうるずれの範囲に対応する被験者数の範囲を示すことで実施することが容易になるであろう。

検証的試験では、通常これらの仮定は公表されたデータ又は先行する試験の結果に基づくべきである。検出すべき試験治療の差は、患者の治療管理を行う上で臨床的に意味をもつ最小限度の効果に関する判断又は新しい試験治療の予想される効果の方が大きい場合にはその効果に関する判断に基づいて決まるものであろう。慣例的に、第一種の過誤は5%以下に設定され、多重性を考慮するために必要な調整がなされる場合はそれに従って設定される。検証すべき仮説のもっともらしさ及び検定結果に望む影響力の強さにより、第一種の過誤の的確な選択に影響が及ぼされるであろう。第二種の過誤は、慣例として10%～20%に設定される。第二種の過誤を実施可能な範囲でできる限り小さくすることは、特に繰り返すことが困難又は不可能な試験の場合、治験依頼者の利益となる。慣例として用いている第一種の過誤の値及び第二種の過誤の値とは異なる値を用いることも許容される場合があり、むしろそれが好ましいこともあり得る。

被験者数の計算は、主要な解析で用いる解析対象集団に基づくべきである。解析対象集団が「最大の解析対象集団」である場合、効果の大きさに関する見積値は、治験実施計画書に適合した対象集団（用語集参照）の場合に比べて小さくする必要があろう。これは、試験治療を中止した被験者又は服薬遵守状況の悪い被験者を解析に含めることにより、試験治療の効果が薄められることを考慮するためである。このときばらつきに関する仮定も再検討する必要があろう。

同等性試験又は非劣性試験の被験者数（3.3.2節参照）は、通常試験治療の差の信頼区間を用いて、試験治療間の差が最大でも臨床的に許容できる範囲であることを示すという目的に基づいて計算すべきである。同等性試験での検出力が真の差をゼロとして設定されている場合、真の差がゼロでなければ、この検出力を達成するために必要な被験者数よりも少なく見積もられることになる。非劣性試験での検出力が差をゼロとして設定されている場合、被験薬の効果が実対照薬の効果よりも小さければ、この検出力を達成するための必要な被験者数よりも少なく見積もられることになる。「臨床的に許容できる」差は、その選択に当たり市販後使用される患者に対してどのような意味を持つかに関する正当な理由が必要であり、差が存在することを立証するために計画する優越性試験において参照した前述の「臨床的に適切な」差よりも小さくなるであろう。

逐次群試験での正確な被験者数は、選択した中止指針と真の試験治療の差に依存する上に、偶然の動きにも左右されるため、事前には固定できない。中止指針の設計には、試験を続けた際の被験者数の分布を考慮すべきであり、通常これは期待被験者数及び最大被験者数により具体的に示される。

イベント発生率が予想よりも低い場合、又はばらつきが予想よりも大きい場合は、割付を明らかにすること又は試験治療間の比較を行うことなく被験者数を見直すことができる（4.4節参照）。

3.6 データの獲得と処理

治験責任医師から治験依頼者へのデータの収集と転送は、症例記録用紙、遠隔地モニタリングシステム、医療コンピューターシステム、電子的転送等の様々な媒体で行うことができる。どのようなデータ獲得の手段を用いても、収集する情報の様式及びその内容は治験実施計画書と完全に一致させるべきであり、臨床試験の実施前に確定しておくべきである。収集する情報の様式及びその内容は予定した解析の実施に必要なデータに合わせて考えるべきである。必要なデータには、治験実施計画書遵守状況の確認又は重要な治験実施計画書からの逸脱を明らかにするために必要な背景情報（服薬に対応した評価の時期等）が含まれる。「欠測値」は「ゼロ」又は「該当せず」と区別できるようにすべきである。

データベースの確定までのデータ獲得の手順は、GCPに従って実行すべきである（ICH E6、5節参照）。特に、質の高いデータベースの引き渡しを確かにし、予定した解析の履行を通した試験目的の達成を確かにするためには、データの記録並びに誤り及び無記入の訂正のために、適切なタイミングで信頼できる処理を実施することが、必要である。

参照

「臨床試験のための統計的原則」について

https://www.pmda.go.jp/files/000156112.pdf

リンク