統計学 臨床試験 規制

ICH-E9 臨床試験のための統計的原則 II. 臨床開発全体を通して考慮すべきこと

II. 臨床開発全体を通して考慮すべきこと

2.1 試験の性格

2.1.1 開発計画

新しい医薬品を臨床開発する過程全体を通しての目的は、臨床上の利益との兼ね合いでリスクが許容できる限度において、医薬品が安全性と有効性を兼ね備えている用量範囲と使用スケジュールが存在するかどうかを知ることにある。医薬品から利益を受ける対象となる集団を明確にし、医薬品の適応症も定める必要がある。

これら臨床開発全体としての目的を達成するためには、通常それぞれが特定の目的を持った臨床試験の順序だったプログラムが必要である(ICH E8 参照)。このプログラムは、判断をくだす適切な時点と、知識の蓄積に伴う修正を認める柔軟性を持つ、一つ又は一連の臨床開発計画として明示されるべきである。承認申請では、臨床開発計画の趣旨及び個々の試験がどのように寄与するかについて明確に述べるべきである。試験プログラム全体から得られる証拠の解釈と評価は、個々の試験からの証拠を総合する過程を伴うものである(7.2節参照)。これは、医学用語の辞書、主要な測定の定義と時期、治験実施計画書からの逸脱の取り扱い、といった試験のいくつかの特徴について、共通の基準を採用することで容易になる。医学上の問題に複数の試験によって対応する場合、統計的要約、総括(overview)又はメタアナリシス(用語集参照)が有益であろう。可能であれば、このように対応することは臨床開発計画の中で明確にすべきであり、そうすることによって関連する試験が把握され、試験間で共通にすべき計画上の特徴を前もって特定することができる。

共通の臨床開発計画によって実施される複数の試験に影響することが予測されるその他の主要な統計的問題があるならば、臨床開発計画中に述べるべきである。

2.1.2 検証的試験

検証的試験とは、事前に定められた仮説を評価するための、適切に計画・実施された比較試験である。一般に、検証的試験は有効性又は安全性の確固たる証拠を提示するために必要である。検証的試験では、関心のある重要な仮説は試験の主要な目的から直接導かれ、常に事前に設定され、試験完了後に検証される。検証的試験では、関心のある試験治療に由来する効果の大きさを十分な精度で推定すること、及びそれらの効果を臨床的な意義と関連付けることも同様に重要である。

検証的試験は、承認に関わる主張の裏付けとなる確固たる証拠を提示することを目的としているため、治験実施計画書と標準業務手順書に従うことは特に重要である。このため、やむをえない変更については説明を文書として残すべきであり、変更の影響も検討しておくべきである。個々の検証的試験の計画及び予定している解析の主要な特徴等の重要な統計的側面について、それを正当とする理由は、治験実施計画書に記述すべきである。個々の試験は限られた少数の問題のみを扱うべきである。

承認に関わる主張の裏付けとなる確固たる証拠としては、被験薬が臨床上の利益を持つことを、検証的試験の結果で示す必要がある。したがって検証的試験は、有効性又は安全性の主張に関連した個々の主要な臨床的問題に、明確かつ確定的な回答を与えるのに十分なものであるべきである。更に、意図している患者集団への一般化(用語集参照)の根拠が理解でき、説明できることは重要である。このことによっても、必要な施設(センター)の数と型式(例えば、専門医か一般臨床医か)及び試験の数と型式が影響を受けるであろう。検証的試験の結果は、条件によらず安定しているべきである。場合によっては、一つの検証的試験からの証拠だけで十分であることもありうる。

2.1.3 探索的試験

検証的試験の正当性の根拠と計画は、事前に実施された一連の探索的研究の臨床成績にほとんど常に依存している。すべての臨床試験と同様に、これらの探索的研究も明確で精密な目的を持つべきである。しかし、検証的試験とは対照的に探索的試験の目的は、必ずしも事前に設定した仮説の単純な検定に帰着するわけではない。更に、探索的試験では、結果の蓄積に応じて変更が可能となるような、より柔軟な方法を必要とするときもある。

その解析は探索的なデータ解析を伴ってもよい。すなわち仮説検定を行う場合、その仮説の選択は得られたデータに基づいて行うことが有り得る。このような試験は、有効性を証明する証拠全体には貢献するといってよいが、その正式な証明の根拠にはならない。

個々のいかなる試験も、検証的側面と探索的側面の両方を持つものであるといってよい。

例えば、検証的試験であってもほとんどの場合、結果を説明する又は裏付けする根拠を与えるため、また後の研究の仮説を引き出すためにデータの探索的解析も行われる。治験実施計画書には、各試験について検証的な証明として用いられる側面と、探索的解析のためにデータを提供する側面とを、明確に区別しておくべきである。

2.2 試験で扱う範囲

2.2.1 対象集団

医薬品開発の初期の相では、臨床試験の被験者の選択は、関心のある特定の臨床効果が観察できる見込みを最大にしたいという要求に大きく影響されるであろう。したがって、被験者は、最終的にその薬が使用される全患者集団のうちごく限られた部分集団から選ばれる可能性がある。しかし、検証的試験が実施される時までには、被験者を目標集団に十分近いものにしておくべきである。したがって、検証的試験では一般に、試験治療の効果を精度よく推定するために十分な均質性を維持する一方、目標集団の範囲内でできるだけ広い患者を対象とするような選択基準及び除外基準を定めることが有益である。単一の臨床試験の被験者をもって、将来の使用者を完全に代表させることは期待できない。なぜならば、地理的な位置、試験が実施された時期、個々の治験責任医師や診療所で行われる実地の医療内容などが影響する可能性があるからである。しかし、これらの要因の影響は可能な限り小さくすべきであり、その上で試験の結果を解釈する際にその影響を議論しておくべきである。

2.2.2 主要変数と副次変数

主要変数(「目標」変数、主要評価項目ともいう)は、試験の主要な目的に直結した臨床的に最も適切で説得力のある証拠を与えうる変数であるべきである。主要変数は通常ただ一つにすべきである。ほとんどの場合、検証的試験の主要な目的は有効性に関して科学的に説得力のある証拠を提示することにあるため、主要変数は、通常有効性に関する変数となる。安全性及び忍容性は常に重要な問題であり、ときには主要変数となりうるものである。生活の質(QOL)及び保健経済に関する測定値も、主要変数となる可能性がある。

主要変数の選択には、開発に関連した研究領域で一般に認められている規範と基準を反映させるべきである。先行研究又は公表論文で使用された実績のある、信頼性及び妥当性の確立した変数を使用することが薦められる。主要変数は、選択基準と除外基準によって規定される患者集団において、臨床的に適切で重要な治療上の利益に関する妥当で信頼のおける指標であることが十分に証拠づけられているべきである。被験者数の見積もりに用いる変数は、通常は主要変数であるべきである(3.5節参照)。

多くの場合、被験者の結果を評価する方法はあまり単純ではないであろうから、主要変数は慎重に定義する必要がある。例えば、主要変数を明確に定めないでただ死亡とするのでは不十分である。死亡の評価にも、定められた時点における生存割合の比較、又は特定期間の生存時間分布全体の比較がある。別の例として、事象が繰り返し起こる場合が挙げられる。この場合試験治療の効果の指標としては、単純な二分類の変数(一定期間に一度でも起きたかどうか)、初発までの時間、生起率(単位観察時間あたりの事象数)などがある。慢性疾患のための治療の研究で、経時的に機能の状態を評価する場合も、主要変数の選択に関して別の問題が生じる。可能な対処法としては、観察期間の最初と最後になされた評価の比較、全期間を通じたすべての評価から求めた傾きの比較、定めた閾値を超える若しくは下回る被験者の割合の比較、又は繰り返し測定データのための方法に基づいた比較といった多くのものがある。事後的に定義することから生じる多重性の問題を回避するために、統計解析で用いる主要変数の正確な定義を治験実施計画書に明記することは重要である。更に、選択した特定の主要変数の臨床的な適切さ及びその測定手順の妥当性は、通常治験実施計画書に記載し正当性を示すことが必要である。

主要変数は、その変数を選択した理由とともに治験実施計画書に明記すべきである。割付が明らかになった後に主要変数を定義し直すことは、ほとんどの場合許容できない。なぜならば、それによって生じる偏りの評価が難しいからである。主要な目的として定めた臨床効果を二通り以上の方法で測定しようとしている場合、臨床的な適切さ、重要性、客観性、その他関連する特徴に基づいて、治験実施計画書にはできる限り一つの測定値を主要変数として指定すべきである。

副次変数は、主要な目的に関連した補足的な測定値又は副次目的に関連した効果の測定値のどちらかである。治験実施計画書において副次変数を事前に定義し、試験結果の解釈の際に副次変数が果たす相対的な重要性と役割を説明することも重要である。副次変数の数は、試験で答えるべき限られた少数の問題と関連して制限すべきである。

2.2.3 合成変数

主要な目的に関する複数の測定値の中から、主要変数として一つを選ぶことができない場合、それに代わる有用な戦略は、事前に定められたアルゴリズムを用いて、複数の測定値を単一の変数、つまり「合成」変数に統合又は結合することである。実際、主要変数を複数の臨床測定値の組み合わせとして定める例がみられる(例えば、関節炎、精神障害その他で用いられる評価尺度)。この方法は、多重性の問題に対処するに当たり、第一種の過誤の調整を必要としない。複数の測定値を結合する方法は、治験実施計画書に明記すべきであり、得られた尺度について、臨床的な利益の大きさを適切にあらわしているかどうかという観点から説明がなされるべきである。合成変数が主要変数として用いられる場合、合成変数の成分に臨床的意義がありかつ妥当性が示されているならば、その成分を個別に解析することがある。評価尺度を主要変数として用いる場合、内容的妥当性(用語集参照)、評価者内信頼性(用語集参照)及び評価者間信頼性(用語集参照)並びに疾病重症度の変化を検出するための反応性といった特性を説明しておくことは、特に重要である。

2.2.4 総合評価変数

場合によっては、試験治療の全体的な安全性、全体的な有効性、全体的な有用性を測定するために、「総合評価」変数(用語集参照)が作られることもある。この種の変数は、被験者の状態又はその変化についての客観的変数と治験責任(分担)医師の全体的な印象を統合した、通常は順序カテゴリの評価尺度となる。全体的な有効性の総合評価は、神経科、精神科など一部の治療領域で確立されている。

総合評価変数は、一般的に主観的な要素を併せ持っている。総合評価変数を主要変数又は副次変数として使用する際は、尺度に関する以下の事項についての詳細を治験実施計画書に記述する必要がある:

1) 試験の主要な目的に対する尺度の適切さ
2) 尺度の妥当性及び信頼性の根拠
3) 個々の被験者を尺度のカテゴリの内の一つに判定するための、その被験者から集められたデータの利用法
4) 欠測データがある被験者を尺度のカテゴリの内の一つに判定するための方法又は被験者を評価する方法

総合評価を実施する際、治験責任医師によって考慮されている客観的な変数があれば、それらの客観的変数は主要変数又は少なくとも重要な副次変数として追加することを検討すべきである。

有用性の総合評価は、医薬品の使用による利益とリスクの両方の要素を統合するもので、医薬品の使用を決定するために、その使用による利益とリスクの比較検討をしなければならない臨床医の意思決定過程を反映したものである。有用性の総合評価尺度の問題点の一つは、二つの試験治療が有益な効果と有害な作用に関する全く異なるプロファイルを持っているにもかかわらず、有用性の総合評価を用いることで同等と示す結果を導く場合があることである。例えば、試験治療の有用性総合評価が他方の試験治療に対して同等である、又は優っているとの結果であっても、それは有害な作用が少ないだけで、試験治療には有効性がほとんど又は全くないという事実を意味しているおそれがある。したがって、有用性の総合評価を主要変数とすることは薦められない。有用性の総合評価を主要変数とする場合には、有用性の総合評価に用いた特定の有効性及び安全性の結果を主要変数として別個に追加して考慮することが重要である。

2.2.5 複数の主要変数

治療の及ぼす効果の範囲を一つ一つの変数(又は変数の組)が包含するような、複数の主要変数を用いることが望ましい場合がある。この型式の証拠を解釈する方法は、事前に慎重に説明しておくべきである。試験の目的を達成するために必要と考えられるのは、複数の変数のいずれかに対する効果なのか、ある一定数の変数に対する効果なのか、又は変数すべてに対する効果なのかを明らかにすべきである。一つ又は複数の主要な仮説と関心のあるパラメータ(例えば、平均、割合、分布の状況)は、指定した複数の主要変数に関して明確に決められているべきであり、また統計的推測の方法も明確に述べるべきである。

このとき、多重性の問題が起こり得るため、治験実施計画書では、第一種の過誤に与える影響を説明し(5.6節参照)、それを制御する方法を定めるべきである。第一種の過誤への影響を評価するためには、提案した複数の主要変数間の内部相関の程度を考慮する必要があろう。指定した主要変数のすべてにおいて有効性を示すことが試験の目的である場合、第一種の過誤を調整する必要はないが、第二種の過誤及び必要な被験者数への影響は慎重に考慮すべきである。

2.2.6 代替変数

実際の臨床的有効性を観察することにより被験者の臨床的な利益を直接評価することが実際的でない場合には、間接的な基準(代替変数、用語集参照)を考慮することができる。

代替変数は、それが臨床的利益の信頼できる予測因子であると信じられている多くの領域において、一般的に容認されたものとして用いられている。代替変数を提案し導入する際には、大きな問題が二つある。一つめは、代替変数が関心のある臨床結果の真の予測因子ではないおそれがあることである。例えば、代替変数はある特定の薬理作用と関連した試験治療の作用を測定しているだけで、肯定的であろうと否定的であろうと、試験治療の作用範囲と最終的な効果の範囲に関する完全な情報はもたらさないおそれがある。提案された代替変数においては非常に有効であることを示している試験治療が、結局は被験者にとって臨床上有害であると示された例は数多い。それとは逆に、提案された代替変数には何の影響もないが、臨床的には利益をもたらした試験治療の例もある。二つめは、提案された代替変数が、有害作用に対して直接比較考量することのできる臨床的利益の定量的な指標とは必ずしもならないことである。代替変数の妥当性を確認する統計的基準は提案されているが、その基準を使用した経験は限られている。実際には、代替性の証拠の強さは、(i) 代替変数と臨床的結果の関連の生物学的合理性、(ii) 代替変数が臨床的結果の予後を予測する上で有益であると疫学研究によって示されていること及び (iii) 試験治療の代替変数に対する効果が臨床的効果と対応しているという臨床試験の結果、に依存している。ある医薬品における臨床的変数と代替変数との関係は、同じ疾患の治療に用いる医薬品であっても、作用機序の異なる医薬品について当てはまるとは限らない。

2.2.7 カテゴリ化した変数

連続変数若しくは順序変数の二分化又はその他のカテゴリ化を行うことが、望ましい場合もある。「成功」又は「反応あり」という基準は二分化のよくある例であり、例えば、連続変数では(基準となる時点での値から)何パーセント以上の改善か、又は順序評価尺度であれば、ある閾値レベル(例えば「良好」)以上に分類されるか、という観点から二分化の方法を正確に記述することが要求される。拡張期血圧が90mmHgを下回るまで低下するかどうかを基準にして二分化することは、その例である。カテゴリ化が最も有用なのは、それが明確な臨床的意味を持つ場合である。試験の結果を知った後でカテゴリ化の基準を決めることは偏りを生じやすいため、カテゴリ化の判定基準は前もって定め、治験実施計画書中に明記すべきである。カテゴリ化は一般に情報の損失となるため、結果として解析での検出力の低下を招く。被験者数の計算では、この点を考慮すべきである。

2.3 偏りを回避するための計画上の技法

臨床試験で偏りを回避するための最も重要な計画上の技法は、盲検化及びランダム化(無作為化)であり、これらは承認申請に利用することを目的とするほとんどの比較臨床試験で標準的に採用すべきである。そのような試験は、ほとんどの場合二重盲検法によるものであり、治験薬を適切なランダム割付表に従って事前に箱詰めし、試験の実施に関係する者全てが個々の被験者に割付けられた試験治療を、その試験治療のコードのみであっても、知ることのないよう被験者番号と治療期間のみを表示して治験実施施設に供給するというものである。2.3.1節全体と2.3.2節のほとんどでは、上記の方法を前提とし、2.3.2節最後にその他の方法を述べる。

試験の実施に伴って発生する十分な解析が損なわれる可能性のあるあらゆる変則的な事例について、予想されるもの全て(様々な種類の治験実施計画書違反、試験治療の中止及び欠測値など)の発生頻度を最小にするための手段を治験実施計画書に明記することにより、計画段階で偏りを減じることも可能である。治験実施計画書では、そういった問題の発生頻度を減じる方法と、データ解析において起こる問題の対処法の両方を考慮すべきである。

2.3.1 盲検化

盲検化又はマスク化は、臨床試験の実施及び解釈における意識的、無意識的な偏りの発生を制限するために行われる。割付けられた試験治療を知ることが、被験者の募集と割付、それに引き続き行われるケア、被験者の試験治療に対する態度、評価項目の評価、試験治療を中止した被験者の取り扱い、解析からのデータの除外等に影響を及ぼし、偏りを発生させるためである。盲検化の本質的な目的は、割付けられた試験治療を知ることにより偏りが生じる可能性のある間は、試験治療が同定されるのを防ぐことである。

二重盲検試験は、被験者並びに被験者の試験治療又は臨床評価を行う治験責任(分担)医師及び治験依頼者のスタッフのすべての者が被験者に割付けられた試験治療を知ることができないものである。これには、被験者の適格性の判断、評価項目の評価及び治験実施計画書遵守状況の評価に関わる者すべてが含まれる。この盲検化のレベルは治験実施中維持され、許容できる質にまでデータクリーニングが行われてはじめて、適切な関係者に割付が明らかにされる。被験者に対し試験治療又は臨床評価を行っていない治験依頼者のスタッフ(例えば、生体試料分析者、監査担当者、重大な有害事象報告にたずさわる者)に試験治療コードの割付を明らかにする必要が生じた場合のために、治験依頼者は、試験治療コードの不適切な開示を防ぐための標準業務手順書を持つべきである。単盲検試験とは、治験責任医師若しくはそのスタッフのどちらか又は両方が割付けられた試験治療を知っているが、被験者が知ることはない試験であり、逆の場合もありうる。非盲検試験とは、どの試験治療が割付けられたかが全員に知られている試験である。この中で二重盲検試験が最適な方法である。二重盲検試験においては、試験中実施される複数の試験治療が、実施前にも実施中にも区別できないこと(外見、味、その他)及び全試験期間中盲検を適切に維持することが必要である。

二重盲検という理想の実現が困難な場合も生じる可能性がある。比較する試験治療が、例えば外科的療法と薬物療法のように、完全に異なる性質を持つ場合である。治験薬剤型が異なる場合もある。カプセルの使用によって識別不能にできたとしても、剤型の変更が薬物動態と薬力学の性質のどちらか又は両方を変える可能性もあるため、この場合は剤型間の生物学的同等性を立証する必要があろう。二つの治験薬の毎日の服薬パターンが異なる場合もある。こういった状況で二重盲検の状態を達成する一つの方法は、「ダブルダミー」(用語集参照)技法を用いることである。しかし、この技法は、被験者の服薬に対する動機づけを低下させ服薬遵守に悪影響を与えるような通常はありえない服薬計画を強いる場合がある。また、例えば二重盲検を保つために偽の手術を必要とする場合のように、倫理的な問題により、ダブルダミーの使用が妨げられることがある。それでも、これらの問題を克服するための十分な努力をすべきである。

明らかに試験治療に由来する効果により、一部の臨床試験では部分的に二重盲検が破れるおそれがある。そのような場合、ある種の検査結果(例えば、臨床検査項目の一部)を治験責任(分担)医師及び関連する治験依頼者スタッフが知ることのないようにすることにより、盲検性が改善されるであろう。試験治療特有の又は特定できるような効果により、個々の被験者の割付が明らかになるおそれのある試験では、後述する非盲検試験で偏りを最小にする手法と同様の手法を検討すべきである。

二重盲検試験が実施できない場合は、次に単盲検を選択することを検討すべきである。非盲検試験のみが実際的に又は倫理的に可能な場合もある。単盲検試験と非盲検試験は二重盲検試験に比べて柔軟性があるが、次の試験治療が何であるか治験責任(分担)医師が知ることにより、被験者の登録の決定に影響を与えないようにすることが重要である。登録の決定は、常に割付けられる試験治療を知る以前になされるべきである。これら単盲検又は非盲検試験では、試験治療のランダム割付を管理するために、電話による割付のような一ヵ所でランダム化を行う方法を検討すべきである。更に、臨床評価は被験者の処置を行っておらず、試験治療が盲検化された状態の医療スタッフによってなされるべきである。

単盲検試験又は非盲検試験では、様々な既知の偏りの原因を最小にするために、あらゆる努力をなすべきであり、主要変数は可能な限り客観的にすべきである。採用した盲検化の程度について、それを選択した理由は、偏りを減じるために用いた他の手段による処置とともに、治験実施計画書に述べるべきである。例えば治験依頼者は、解析のためにデータベースを公開する前のデータベースクリーニングの段階では、試験治療コードへのアクセスが適切に制限されることを保証するために十分な標準業務手順書を用意すべきである。

(被験者個人について)割付を明らかにすることは、割付けられた試験治療を知ることが被験者のケアのため本質的であると主治医が考える場合に限り検討すべきである。故意であろうとなかろうと、割付を明らかにした場合は、開示の理由にかかわらず、治験終了時に報告し、説明すべきである。割付けられた試験治療を明らかにするための手続きと時期は記録しておくべきである。

本ガイドラインでは、試験完了(最後の被験者の最終観察)から割付を明らかにするまでの間にデータをチェックすることを、データの盲検下レヴュー(用語集参照)と呼ぶ。

2.3.2 ランダム化(無作為化)

ランダム化は、臨床試験において、被験者への試験治療の割付に意図的に偶然の要素を取り入れており、後に試験データを解析する際に、試験治療の効果に関する証拠の定量的な評価のための正しい統計的根拠を与える。また、ランダム化は予後因子が既知であるか未知であるかにかかわらず、予後因子の分布が類似した試験治療グループを作るために役立つものである。ランダム化は、盲検化と組み合わせることで、試験治療の割付が予見可能な場合に、被験者の選択的割付によって生じる可能性のある偏りを回避することに役立つものである。

臨床試験のランダム割付表は、被験者への試験治療のランダム割付を記録するものである。最も単純な状況では、割付表は一連の試験治療のリスト又は(クロスオーバー試験では、試験治療の順序のリスト)被験者番号に対応するコードである。スクリーニングの段階がある試験のような、一部の試験の実施手順は問題をより複雑なものにすることがあるが、被験者に対する試験治療又は試験治療の順についての事前に予定された唯一通りの割付は明確にすべきである。試験計画が異なれば、ランダム割付表の作成のためにも異なる手順が必要である。(必要な場合に備えて)ランダム割付表は、再現可能なものとすべきである。

制約をおかないランダム化は受け入れ可能な方法ではあるが、一般にはブロック別にランダム化する方が有利な点がある。このブロック別ランダム化の方法は、試験治療グループ間の比較可能性を高めることに役立つものである。これは例えば募集方針の変更により、結果として被験者の特徴が時間的に変化する可能性があるような場合である。また、ブロック別ランダム化は試験治療グループの被験者数をほぼ等しくすることを保証する。クロスオーバー試験では、ブロック別ランダム化を採用することが、効率が高く解釈しやすいバランスのとれた計画を得る手段となる。ブロックの長さは、被験者数のバランスが崩れる可能性を制限できる程度に短く、しかしブロックの終りの方での予見可能性を回避できる程度に十分長くするように注意すべきである。治験責任医師及びその他関係するスタッフは、一般にブロックの長さを知ることがないようにすべきである。二つ以上の異なるブロックの長さを用いて、それぞれのブロックで異なる長さをランダムに選ぶことにより、同じ目的を達成できる。(理論的には、二重盲検試験において予見可能性は問題とならない。しかし、治験薬の薬理作用により、知的な当て推量をする機会を提供してしまうおそれがある。)

多施設共同治験(用語集参照)では、ランダム化の手続きは中央で準備すべきである。施設で層別する、又は各施設にブロック全体を数個割付けるといった、各施設毎にランダム化する計画を立てることが推奨される。より一般的には、基準となる時点で測定された重要な予後因子(例えば、疾患の重症度、年齢、性、など)で層別することは、層内でバランスのとれた割付を促進するために有益といってよい。これは小規模な試験では大きな潜在的利益となる。三つ又は四つ以上の層別因子を用いる必要はほとんどない。そのうえ、例数のバランスがとりにくく、実施が煩雑になる。後述する動的割付法を用いることは、多数の層別因子のバランスを同時にとることに役立つであろう。そのためにはその後の試験手続きをこの型式の方法に応じて調整する必要がある。層別ランダム化に用いた因子は、後の解析の際にも考慮すべきである。

ランダム割付けされ試験に組み入れられる被験者は、常に適切なランダム割付表(層別ランダム化の場合には、各層ごと)の中の、まだ割付けられていない最初の番号に対応した試験治療を受けるべきである。次の被験者の該当番号とそれに対応する試験治療は、被験者が試験のランダム割付段階へ登録されたことを確認してから、はじめて割付けるべきである。予見可能性を高めてしまうようなランダム化に関する内容の詳細(例えば、ブロックの長さ)については治験実施計画書に含めるべきではない。ランダム割付表自体は、全試験期間において、盲検性が適切に維持されることを保証する方法で、治験依頼者又は第三者によって安全に保管されなければならない。どの被験者についても緊急の場合には割付を明らかにしなければならないことがあるため、試験中ランダム割付表にアクセスする可能性を考慮すべきである。その際に従うべき手順、必要な証拠資料及び割付を明らかにした後の被験者の治療と評価の仕方はすべて治験実施計画書に記述すべきである。

動的割付は割付方法の選択肢の一つであり、被験者への試験治療の割付に、現在までに割付けられている試験治療の例数バランスを反映させ、層別された試験では被験者が属する層での試験治療の例数バランスを反映させるものである。決定論的な動的割付法は避けるべきであり、試験治療の一つ一つの割付にランダム化の要素が適切に取り入れられるべきである。動的割付法を取り入れた試験の二重盲検性を保つためには、あらゆる努力がなされるべきである。例えば、通常は電話登録を用いることにより動的割付を管理している中央治験事務局以外は試験治療コードを知ることができないようにする方法が採られるであろう。この方法は結果として、(電話登録時に)適格基準の追加確認を可能とし、試験への登録を確定する。これらの特徴はある種の多施設共同治験では有益である。二重盲検試験において通常用いられる治験薬を事前に箱詰めし、ラベルを貼り供給するシステムを、動的割付でも用いることができる。ただし、使用する順番は番号順ではなくなる。中央治験事務局の職員に、試験治療コードを知られることがないようにするため、適切なコンピュータアルゴリズムを用いることが望ましい。動的割付を検討する場合には、実施手順の複雑さと解析に与える潜在的な影響を慎重に評価すべきである。

参照

「臨床試験のための統計的原則」について

https://www.pmda.go.jp/files/000156112.pdf

-統計学, 臨床試験, 規制

© 2021 Real-World Data/Evidence website