統計学 臨床試験 規制

ICH-E9 臨床試験のための統計的原則 - 質疑応答

Table of Contents

「臨床試験のための統計的原則」に関する質疑応答

Q1. 本ガイドラインで定義される試験統計家の要件とは具体的にどのようなものか。

(答)
現時点では、ガイドラインの「十分な理論又は実地の教育及び経験を合わせ持ち、臨床試験における統計的側面に責任をもつことができる者」という以上に具体的な要件は定められていない。治験依頼者は、ガイドラインの趣旨を踏まえ、生物(医学)統計学に関連して、大学等の教育機関において受けた教育の内容、卒業後の研修・訓練の状況、研究業績、実際の臨床試験に対してどのような立場でどの程度関わったかといった経験等を総合的に判断して個々の試験での試験統計家の選定に当たっていただきたい。

また、「治験の総括報告書の構成と内容に関するガイドライン(平成8年5月1日薬審第335号)」では、試験に関与した者の履歴等の文書を作成することを求めている。審査の際には必要に応じ、どのような者が試験統計家として選定されたか確認するため、これらの資料の提出を求めることがある。

Q2. 片側検定又は両側検定のどちらを用いるか、またそこでの有意水準をいくらにすべきかを、優越性試験と非劣性試験のそれぞれで説明願いたい。

(答)

ガイドラインでは、同等性を示す場合には両側信頼区間、非劣性試験では片側信頼区間による解析を行うことが記載されているが、一般には推測を片側と考えるか両側と考えるかには議論があり一概に決められるものではないとされている。また、有意水準についても、個々の試験において適切な基準を設定すべきである旨の記載がある。

しかしながら、推論を片側とするか両側とするかにより統計的な判断に大きな差異が生じることは規制上の観点から望ましくない。また、一方で、臨床試験における有効性の評価では、検定により有意差があるか否かを判断するだけでなく、試験治療効果の大きさ(比較群間の差の大きさ)がどの程度であるかを推定することも重要である。

そこで、今後は、検証的試験においては、仮説の検定においてどちらの方法を用いる場合であっても、効果の推定には95%信頼係数の両側信頼区間を用い、検定の際の有意水準は、これによる判断との整合性を図るため、優越性試験、非劣性試験のいずれにおいても、片側2.5%又は両側5%とすることを原則とする。用量反応試験についても、用量反応性を示すことにより薬剤の有効性を検証するような試験においては上記と同様である。ただし、適切な説明ができるのであれば、より強固な有効性の根拠を示すために有意水準を厳しくする、稀少疾病用医薬品にみられる例のように十分な被験者を集めることが困難な場合は有意水準を緩くする、などの措置をとってもよい。

なお、生物学的同等性試験については、「後発医薬品の生物学的同等性試験ガイドライン(平成9年12月22日医薬審第487号)」により、90%信頼係数の両側信頼区間を用いるとされているが、臨床効果を指標に標準製剤との同等性を検証しようとする場合(臨床的同等性試験)は、上記と同様に95%信頼係数の両側信頼区間を用いることを原則とする。

Q3. 2.1.2には「一つの検証的試験からの証拠だけで十分であることもあり得る」とあるが、申請までに通常複数の検証的試験が必要であると考えるのか。

(答)

承認申請に当たっては、検証的試験により承認に関わる主張の裏付けとなる十分な証拠を提示する必要があるとともに、実際に薬剤が使用される状況や適用の範囲等を考慮して、意図している患者集団に対する一般化の根拠を説明できることが重要である。したがって、検証的試験が一つの場合には、承認の根拠となる証拠が十分に認められるか又は他の資料から一定の根拠が得られること等が必要であろう。また、一般化の根拠についても十分な説明が必要であり、例えば、少数の施設で限定された状況において行われた一つの検証的試験のみで広範囲での使用を予定した申請を行う場合には、特にその根拠を十分説明できることが必要である。

Q4. 多施設共同治験においては、どのような考え方で施設当たりの被験者数を設定すればよいか。

(答)

多施設共同治験に関しては、ガイドラインでは主に固定効果モデルを前提に議論されている。被験者数の設定については、施設効果及び試験治療と施設の交互作用を推定し、不均一性がみられた場合、試験の運営管理や被験者の特徴といった面から説明できるか十分に調べるべきであることから、施設当たりの被験者数を多くすることが原則であり、同時に施設間で被験者数に大きな差が生じないよう施設の選定に十分配慮する必要がある。具体的な被験者数は対象となる疾患や試験治療により異なるが、一群10例以上が一つの目安である。また、施設当たりの被験者数が少なくなる場合であっても、施設当たりの被験者数に大きな差が生じることのないよう配慮する必要がある。施設当たりの被験者数が少なくなる場合には、施設数が多くなることにより、混合モデルを用いることが適切な場合があるが、施設当たりの被験者数が少ないと治験の質及び盲検性を確保することが難しくなることが指摘されており、解析の結果不均一性がみられた場合であっても施設の運営管理や被験者の特徴と結びつけることは一般には困難であることに注意すべきである。

いずれにしても、これらの検討結果を一般化の議論と結びつけるためには、実際の臨床現場ではどのような治療が行われるかを念頭に置き、どのような施設を選定するかが重要である。

なお、ガイドラインで記載しているように、ここでいう施設は必ずしも一つの医療機関を指すものではない。特定の複数の医療機関について、試験実施の観点からは一つの医療機関とみなすことが可能とする適切な根拠があるときは、これらの医療機関をまとめて一施設として取り扱うことができる。

Q5. 「臨床試験の統計解析ガイドライン(平成4年3月4日薬新薬第20号)」では第Ⅲ相試験において2群比較を推奨していたが、3.3.2の記述は、この方針を変更して3群以上の比較試験を推奨していると考えるべきか。

(答)

3.3.2で記載されているとおり、例えば実薬を対照として行われる同等性試験又は非劣性試験においては、プラセボを加え3群の比較試験を行うことにより、重要な情報を得られる場合がある。同等性試験や非劣性試験に限らず、試験計画を立案する際には比較の型式についての十分な検討を行うことが重要であり、必要に応じてどのような計画を用いるか決定すべきである。したがって、2群比較のみを推奨するということはない。

なお、臨床試験における対照群の選択の問題は、ICHにおいて別途設けられた専門家委員会(E10)で検討が行われているので、そちらも参照されたい。

Q6. 同等性又は非劣性試験での同等限界はどのように設定すればよいか。

(答)

同等限界は、疾患の領域や薬剤の性質、評価変数が計数値か計量値かなどを考慮し、臨床的な見地から、それぞれ設定すべきであり、領域毎に専門的な合意が得られていることが望ましい。そうでない場合には、申請者が個々の臨床試験において臨床的に適切と考えられる値を設定することになるが、承認申請においては、設定した同等限界の妥当性の根拠を明示し、説明できることが重要である。実薬対照の非劣性試験を行う場合には、少なくともプラセボとの差が明確となる範囲を設定する必要がある。

Q7. 3.2では「試験治療の主効果は、最初に施設と試験治療の交互作用を含まず施設間差を考慮に入れるモデルを用いて調べることができる」とあるが、交互作用の有無を最初に検討しないのはなぜか。

(答)

本ガイドラインは、試験治療効果をまず調べるという立場で記載されており、このような考え方に立って、施設と試験治療の交互作用を含めず施設間差を考慮に入れるモデルを用いて調べる方法が記載されている。これは、交互作用を考慮しなくてよいという意味ではない。むしろ、このようなモデルで解析を行った場合には、仮に交互作用が存在する場合であっても、その影響を上回る差が試験治療間に存在することが必要である。

主効果の存在が確認された場合は、交互作用を調べ、交互作用が認められた場合には結果の安定性を確認することが必要である。特に質的な交互作用が認められた場合にはその理由を考察すべきである。理由が十分に説明できない場合は、追加の試験が必要となる。

また、主効果が認められないときには、仮に交互作用の検討の結果、試験治療がある条件の下に有効であることが示唆されるような場合であっても、新たにそのような条件を考慮した検証的試験を行うことが必要である。

Q8. 本ガイドラインにある二つの解析対象集団(最大の解析対象集団と治験実施計画書に適合した対象集団)のどちらを主とするかをどのように選択すればよいか。

(答)

基本的には本ガイドラインでは最大の解析対象集団を主要な解析対象集団とすることを推奨しているが、同等性試験又は非劣性試験においては、最大の解析対象集団を用いることが必ずしも保守的であるとは言えないことから、その役割を十分慎重に考慮した上で判断すべきである。

一般に、二つの解析集団が著しく乖離するのは、治験実施計画書が遵守されていない場合、治験実施計画書に不備がある場合などが考えられる。どちらも試験の信頼性を損なうものであることから、試験の計画、実施に当たっては二つの解析集団ができるだけ一致するよう努力すべきである。このためには、すべての被験者を可能な限り追跡することも重要である。また、何らかの原因により二つの解析対象集団に乖離が生じた場合には、乖離の原因を明らかにしてそれが結果の偏りをもたらす可能性を吟味し、さらに二つの集団で解析結果がどのように異なるかを検討する必要がある。

Q9. 被験者の解析上の取扱いはどの時点までに決定しておくべきか。

(答)

被験者の解析上の取扱いは、原則として事前に治験実施計画書に記載しておくべきである。しかし、計画書の作成段階では取扱いを定めることができない事項、又は実施中の情報により取扱いを見直さなければならない事項は、盲検下で検討を行い、その取扱いを定めることになる。

なお、従来症例検討の際に慣例的に行われてきたように、試験計画書に記載された取扱いの基準を盲検下レヴューの際に緩和することは望ましくない。試験開始後に、変更又は新たに定める取扱い事項が多いことは試験の妥当性を大きく損なうことに注意すべきである。

非盲検比較試験の場合であっても、被験者への安全上の対策を損なわない範囲で、割付方法、症例報告書への割付薬剤の記載方法、モニタリング方法等を工夫し、可能な限りモニター、データマネジメント担当者、解析担当者等が試験治療の割付を知ることがないようにするとともに、被験者の解析上の取扱い及び試験計画の見直しを行う場合には、可能な限り盲検下で行うべきである。

Q10.GCPでは統計解析計画書に関する記載はないが、統計解析計画書は申請資料の中でどのように位置づけられるのか。

(答)

統計解析計画書は承認申請の必須文書ではないが、治験実施計画書を補足し、解析の詳細を記述したものであるから、要求があれば提出できる形で作成しておくべきである。統計解析計画書の改訂を行っている場合はその履歴も同様である。

なお、外国臨床試験データが申請資料とされている場合には、統計解析計画書の翻訳及び説明を要求することがある。

参照

https://www.pmda.go.jp/files/000156112.pdf

医薬審 第1047号 平成10年11月30日

各都道府県衛生主管部(局)長 殿

厚生省医薬安全局審査管理課長

「臨床試験のための統計的原則」について

近年、優れた新医薬品の地球的規模での研究開発の促進と患者への迅速な提供を図るため、承認審査資料の国際的ハーモナイゼーション推進の必要性が指摘されている。このような要請に応えるため、日・米・EU三極医薬品規制調和国際会議(ICH)が組織され、品質、安全性及び有効性の3分野でハーモナイゼーションの促進を図るための活動が行われている。

別添の「臨床試験のための統計的原則」(以下「本ガイドライン」という。)は、ICHにおける合意に基づき、臨床試験における統計的原則について記載したものであり、臨床試験から得られる結果の偏りを最小にし、精度を最大にすることを目標としている。特に、計画段階から試験統計家が参加すること、治験実施計画書の作成に当たっては解析方法等について妥当性も含め事前明記すること等が強調されており、多施設共同試験における施設の捉え方及び施設当たりの症例数の設定に関する考え方、総合評価変数を用いる際の留意点等についても記載されている。また、検証的位置づけの試験を行う際の有意水準(第一種の過誤)については従来明確にされていなかったが、規制上の観点から、本ガイドラインの施行に伴い、原則として片側仮説を検証する場合は2.5%、両側仮説の場合は5%とすることとした。これらについては、ガイドラインの該当個所及び関係する質疑応答を参照されたい。

本ガイドラインは、本通知の日以降施行し、これに伴い、「臨床試験の統計解析に関するガイドライン(平成4年3月4日薬新薬第20号)」(以下「旧ガイドライン」という。)は廃止する。ただし、治験実施計画書の作成にかかる事項については、既に治験実施計画書が作成され、実施されている臨床試験もあることから、このような場合に配慮し、臨床試験の実施に先立って治験実施計画書が確定される日が平成10年12月31日以前の場合は、被験者数の決定方法も含め旧ガイドラインを参考とした事項があっても差し支えないが、そのような場合であっても、治験実施計画書の改訂又は統計解析計画書の作成を含め、本ガイドラインの趣旨に添って適切と考えられる事項については可能な限り適用することとされたい。

以上の点を御了知の上、貴管下関係者に対し周知方ご配慮願いたい。

-統計学, 臨床試験, 規制

© 2024 RWE