生物学 疫学 統計学

カプランマイヤーからCox回帰まで。生存時間解析ガイド

2025年8月16日

医学研究や多くの科学分野において、私たちが知りたいのは、単にある出来事が「起こったか、起こらなかったか」ということだけではありません。多くの場合、その出来事が「いつ起こったのか」という時間的な情報が、極めて重要な意味を持ちます。例えば、新しい治療法が患者の生存期間をどれだけ延ばすことができるのか、あるいは特定の要因が病気の再発までの期間にどう影響するのか、といった問いに答えるためには、「時間」という要素を分析の中心に据える必要があります。このように、ある特定の「イベント」が発生するまでの時間を分析する統計手法、それが生存時間解析です 1

ここで言う「イベント」とは、研究者が関心を持つ特定の出来事を指します。それは「死亡」かもしれませんし、「病気の再発」、「回復」、「機械の故障」など、研究の目的に応じてさまざまに定義されます。この解析が他の統計手法と大きく異なるのは、「打ち切り」という特殊なデータの存在を適切に扱える点にあります 3

「打ち切り(censoring)」とは、研究の観察期間が終了するまでに、一部の対象者でイベントが発生しなかった、あるいは発生したかどうかを確認できなくなった状況を指します 4。例えば、5年間の臨床試験を考えたとき、試験終了時点でまだ生存している患者さんがいるでしょう。この患者さんについては、少なくとも5年間は生存したという貴重な情報がありますが、最終的にいつまで生存するのかは分かりません。これが打ち切りの一例です。他にも、患者さんが遠方に引っ越してしまって追跡できなくなった(追跡不能)、あるいは研究への参加同意を撤回した、といった理由で観察が終了することもあります 4

ここで絶対に誤解してはならないのは、打ち切りデータは「欠損データ」ではないということです。打ち切られた対象者について、私たちは「少なくとも観察が終了した時点まではイベントを経験していない」という確かな情報を持っています 4。もしこの貴重な情報を無視して、イベントが観察された人たちだけで平均生存期間などを計算してしまうと、生存期間を実際よりも短く見積もってしまうことになり、研究の結論に深刻な偏り(バイアス)を生み出してしまいます。一般的な平均値の計算やt検定のような統計手法は、このような時間と打ち切りの両方を含むデータを正しく扱うことができません 1

生存時間解析は、この「打ち切り」という不完全ながらも重要な情報を捨て去ることなく、統計モデルの中に正しく組み込むことで、より正確に集団の生存傾向を推定することを可能にします。この特性こそが、生存時間解析を臨床研究をはじめとする多くの分野で不可欠なツールとしている理由なのです。本記事では、この生存時間解析の中でも特に重要な三つの手法、すなわち「カプランマイヤー法」「ログランク検定」「Cox比例ハザード回帰」、そしてそれに付随する重要な確認事項について、順を追って丁寧に解説していきます。

カプランマイヤー法とは

生存時間解析の第一歩は、多くの場合、データを視覚的に理解することから始まります。そのための最も基本的かつ強力なツールが「カプランマイヤー法」であり、それによって描かれるグラフは「カプランマイヤー曲線」と呼ばれます 2。この手法の素晴らしい点は、特定の確率分布を仮定しない「ノンパラメトリック」なアプローチであるため、データの背後にある複雑な仮定を置くことなく、生存の様子をありのままに描き出せることです 7

カプランマイヤー曲線がどのように描かれるのか、その手順を言葉で追ってみましょう。まず、グラフの縦軸は「累積生存率」、つまりイベントを経験せずに生存している人々の割合を示します。横軸は時間の経過です。研究が始まった時点(時間ゼロ)では、対象となる集団の全員が生存していますから、曲線は縦軸の最も上、すなわち生存率1.0(または100%)の点から始まります 8

時間が経過しても、イベントが発生しない限り、生存率は変わりません。そのため、曲線は水平に右へと伸びていきます。そして、研究対象の誰かにイベント(例えば死亡)が発生したまさにその時点で、生存率が低下するため、曲線は階段状に一段下がります 8。この階段の一段の高さは、その時点でイベントを経験した人数と、その直前まで生存していた(リスクにさらされていた)人々の総数によって決まります。

では、この過程で「打ち切り」はどのように扱われるのでしょうか。これがカプランマイヤー法の核心部分です。ある対象者が打ち切りとなった時点では、その人はイベントを経験したわけではありません。したがって、生存率そのものは低下せず、曲線は下がることなく水平なままです 2。しかし、その打ち切られた人は、それ以降の生存率計算における「リスクにさらされている集団」の数からは除外されます。つまり、打ち切りは、それ以降に発生するイベントが生存率に与える影響の大きさを計算する際の分母を一つ減らすことで、間接的に曲線に影響を与えるのです。多くのカプランマイヤー曲線では、打ち切りが発生した時点に小さな縦線などの印(ヒゲ)が付けられ、そこで打ち切りがあったことが示されます 8

このようにして、カプランマイヤー法は、各イベント発生時点での生存確率を次々と計算し、それらを掛け合わせることで累積生存率を推定していきます 10。ある時点まで生存する確率は、それ以前のすべての期間を生き延びてきたという条件のもとで、次の瞬間も生き延びる確率の連続的な積み重ねとして表現されるのです。

この曲線からは、いくつかの重要な指標を読み取ることができます。その一つが「生存期間中央値」です。これは、累積生存率が0.5(または50%)になる時点の時間を示します。言い換えれば、集団の半数の人がイベントを経験するまでにかかる時間のことです 2。生存時間解析で平均値ではなく中央値が好まれるのには明確な理由があります。研究終了時点で多くの人が生存(打ち切り)している場合、その人たちの最終的な生存時間は不明なため、正確な平均値を計算することができないからです。中央値であれば、生存率が50%を下回る限り、たとえ最後の生存者がいつイベントを経験するか分からなくても計算することが可能です 1

もう一つは、「年次生存率」のような特定の時点での生存率です。例えば、1年生存率や2年生存率を知りたい場合、横軸でその時点(例えば365日や730日)を見つけ、そこから垂直に上にたどって曲線とぶつかる点の縦軸の値を読み取ればよいのです 8

ただし、カプランマイヤー曲線を解釈する際には注意点もあります。特に、グラフの右側、つまり時間が大きく経過した部分の解釈は慎重に行うべきです 6。なぜなら、時間の経過とともにイベントや打ち切りによって対象者の数は減少し、グラフの右端ではごく少数の人々しか残っていない場合があるからです。そのような状況では、たった一人のイベントが生存率を大きく引き下げるように見え、偶然による変動の影響を強く受けてしまいます。そのため、優れたカプランマイヤー曲線の図には、グラフの下に各時点でのリスク対象者数が併記されることが多く、解釈の信頼性を判断する上で重要な情報となります。

ログランク検定 ― 生存曲線の差を科学的に検証する

カプランマイヤー曲線によって、異なる治療法を受けた二つのグループや、ある特性を持つグループと持たないグループの生存の様子を視覚的に比較することができます。例えば、片方の曲線がもう一方の曲線よりも常に上方に位置していれば、そちらのグループの方が生存率が高いように見えます。しかし、その見た目の差は、本当に意味のある差なのでしょうか、それとも単なる偶然の産物なのでしょうか。この問いに統計的な根拠をもって答えるための手法が「ログランク検定」です 12

ログランク検定は、カプランマイヤー曲線で描かれた二つ以上の生存曲線が、統計的に有意に異なるかどうかを検証するための仮説検定です。この検定の基本的な考え方は、「もし比較しているグループ間に生存に関する真の差がない(帰無仮説が正しい)としたら、観察されたイベントの分布はどのようになるだろうか」というものです。

具体的には、検定はイベントが発生した各時点に注目します。そして、その時点で各グループに実際に観察されたイベント数(観察値)と、もしグループ間に差がないとした場合に期待されるイベント数(期待値)を比較します 12。期待値は、その時点での各グループのリスク対象者数の比率に基づいて計算されます。この「観察値」と「期待値」の差を、すべてのイベント発生時点で計算し、それらを全体として合計します。もし、この差の合計が非常に大きければ、それは偶然では起こりにくいと考えられ、「グループ間には生存に関して差がない」という帰無仮説が棄却されます。その結果として、検定の出力であるp値は小さくなります。慣例的に、p値が0.05未満であれば、その差は「統計的に有意」であると判断されることが多いです。

このように、ログランク検定は、二つの生存曲線が全体として異なるかどうかを評価するための、客観的で強力な手段を提供してくれます。しかし、この検定にはいくつかの重要な限界も存在します。

第一に、ログランク検定は、比較しているグループ全体で「差があるかないか」を一つのp値で示すだけです。もし三つ以上のグループを比較している場合、検定結果が有意であったとしても、具体的にどのグループとどのグループの間に差があるのかまでは教えてくれません。

第二に、そしてこれが最も重要な限界ですが、ログランク検定は「単変量解析」であるという点です 2。これは、比較したい一つの要因(例えば、治療法の違い)以外の要因の影響を考慮できないことを意味します。例えば、新しい治療薬を投与されたグループの患者が、プラセボを投与されたグループの患者よりも偶然若かったとします。もし生存期間に差が見られたとしても、その差が治療薬の効果によるものなのか、単に年齢が若かったことによるものなのかを、ログランク検定だけでは区別することができません 13。このような、結果に影響を与えうる他の要因を「交絡因子」と呼びますが、ログランク検定はこの交絡因子の影響を調整する機能を持たないのです。

また、専門的な補足となりますが、ログランク検定はすべてのイベント発生時点を平等に重み付けします。これは、研究期間の初期に生じる差も、後期に生じる差も同じように評価することを意味します。しかし、研究の目的によっては、初期の差により重きを置きたい場合などもあり、その際には一般化ウィルコクソン検定のような別の検定手法がより適していることもあります 15

これらの限界、特に交絡因子を調整できないという点は、より洗練された分析手法の必要性を示唆しています。ログランク検定が「差があるか」という問いに答えるのに対し、次の章で解説するCox比例ハザード回帰は、「他の要因の影響を考慮した上で、ある特定の要因が生存にどれだけの影響を与えるのか」という、より深く、より複雑な問いに答えるための道を開いてくれるのです。

Cox比例ハザード回帰 ― 影響を与える要因を多角的に探る

ログランク検定がグループ間の生存曲線の全体的な差を検証するのに対し、臨床研究で直面する多くの問いはさらに複雑です。「ある治療法の効果を、年齢や病気の進行度といった他の要因の影響を取り除いた上で評価したい」といった場合、私たちは複数の要因を同時に考慮できる「多変量解析」が必要となります。この要求に応えるための、生存時間解析における最も強力で広く用いられている手法が「Cox比例ハザード回帰モデル」です 13

このモデルを理解するためには、まず「ハザード」という概念を把握する必要があります。ハザードとは、ある特定の瞬間におけるイベントの発生しやすさ、いわば「瞬間的なリスク」を指します 17。ある人が特定の時間まで生存してきたという条件のもとで、その直後のごく短い時間にイベントが発生する確率、と考えると分かりやすいかもしれません。このハザードは時間とともに変化する可能性があります。例えば、手術直後はリスクが高いが、時間が経つにつれてリスクが低下していく、といった状況です。

Cox比例ハザード回帰モデルの素晴らしい点は、この時間とともに変化する可能性のあるベースラインのハザードの形状を特定することなく、さまざまな要因(説明変数)がハザードにどのように影響するかを推定できることです。この特性から「セミパラメトリックモデル」とも呼ばれます 7。このモデルが私たちに提供してくれる最も重要な結果が「ハザード比(Hazard Ratio, HR)」です。

ハザード比とは、その名の通り、二つのグループのハザードの比です 16。通常、ある基準となるグループ(参照群)を設定し、それと比較したいグループのハザードが何倍になるかを示します。ハザード比の解釈は非常に直感的です。

もしハザード比が1であれば、二つのグループのハザードは同じであり、その要因はイベントの発生しやすさに影響を与えていないことを意味します 19

もしハザード比が1より大きい場合、例えば2であれば、比較しているグループは参照群に比べて、どの瞬間においてもイベントが発生するリスクが2倍高いことを示唆します。これは、その要因がリスクを高める「危険因子」であることを意味します 17

逆に、ハザード比が1より小さい場合、例えば0.6であれば、比較しているグループは参照群に比べてイベント発生のリスクが40%低い(リスクが0.6倍である)ことを示します。これは、その要因がリスクを低減させる「保護因子」であることを意味します 17

Coxモデルの最大の利点は、複数の説明変数を同時にモデルに投入できることです。これにより、例えば「年齢」と「治療法」を同時にモデルに入れることで、「年齢の影響を調整した上での治療法のハザード比」を推定できます。これは、ログランク検定では不可能だった交絡因子の制御を可能にし、より純粋な要因の効果を評価することを可能にします。

さらに、ログランク検定が「差があるか」というp値しか提供しなかったのに対し、Coxモデルはハザード比という形で、その影響が「どの方向(リスクを高めるか、下げるか)」に「どの程度の大きさ(何倍か)」であるかを定量的に示してくれます。これは、単なる仮説検定から、効果の大きさを推定するという、より情報量の多い分析への移行を意味します。

ただし、ハザード比はあくまで相対的なリスクの指標であり、絶対的なリスクそのものを表すものではない点には注意が必要です 23。また、分析を行う研究者がどのグループを「参照群」として設定するかによって、ハザード比の解釈は変わってきます。例えば、ある病気の進行度を「軽度」「中等度」「重度」の三つのカテゴリーに分けた場合、「軽度」を参照群に設定すれば、「中等度」と「重度」のハザード比は軽度と比較したリスクを示します。この参照群の選択は、分析者が行う重要な判断の一つであり、結果を解釈する上で常に意識しておく必要があります。

このように、Cox比例ハザード回帰は、複数の要因が絡み合う複雑な現実を統計的に解き明かすための、非常に洗練された強力なツールなのです。しかし、この強力なモデルには、その信頼性を担保するための極めて重要な「お約束」が存在します。次の章では、その最も重要な仮定である「比例ハザード性」について詳しく見ていきます。

比例ハザード性の確認 ― Cox回帰モデルの信頼性を担保する

Cox比例ハザード回帰モデルは非常に強力なツールですが、その力を正しく発揮するためには、一つの大前提が満たされている必要があります。それが「比例ハザード性の仮定」です 24。この仮定を理解し、それが満たされているかを確認する作業は、Coxモデルを用いた分析において絶対に省略することのできない、科学的誠実さを担保する上で極めて重要なステップです。

比例ハザード性の仮定とは、比較している二つのグループ間のハザード比が、時間の経過に関わらず一定である、というものです 17。言い換えれば、ある要因(例えば、治療薬の投与)がイベントのリスクに与える影響の度合い(ハザード比)は、研究期間の初期でも、中期でも、後期でも変わらない、という仮定です。もしある薬が投与開始1ヶ月後時点で死亡リスクを半分にする(ハザード比が0.5である)ならば、1年後や2年後においても、リスクを半分にする効果が持続している、と仮定しているのです 26

なぜこの仮定がそれほど重要なのでしょうか。もし、この仮定が成り立っていないにも関わらずCoxモデルを適用してしまうと、モデルが算出する一つのハザード比は、実は時間とともに変化している効果を無理やり平均化した、意味のない値になってしまうからです 25。例えば、ある治療法が短期的には効果が高いものの、長期的には効果が薄れていく、あるいは逆効果になるという場合、ハザード比は時間とともに変化します。このような状況で算出された単一のハザード比は、その治療法の真の姿を正しく反映しておらず、誤った臨床的判断を導きかねません。モデルの信頼性そのものが、この仮定の上に成り立っているのです。

この仮定が満たされているかどうかを直感的に把握する一つの方法は、カプランマイヤー曲線を目で確認することです。もし比例ハザード性が成り立っていれば、二つの生存曲線は、時間の経過とともにある程度の間隔を保ったまま、おおよそ平行に推移していくはずです 25。逆に、二つの曲線が途中で交差したり、最初は離れていたのに後から近づいてきたりするような場合は、ハザード比が時間とともに変化している、つまり比例ハザード性の仮定が満たされていない可能性を強く示唆します 25

もちろん、目視による確認だけでなく、より客観的にこの仮定を検証するための統計的な方法も存在します。その代表的なものが「シェーンフェルト残差(Schoenfeld residuals)」を用いた検定です。この手法の詳しい計算は専門的になりますが、その考え方を概念的に説明します。イベントが発生するたびに、そのイベントを経験した人の特性と、その時点でリスクにさらされていた集団全体の平均的な特性との差を「残差」として計算します。もし比例ハザード性が成り立っていれば、この残差を時間の経過に対してプロットしたときに、特定の傾向やパターンは見られないはずです。つまり、プロット上の点が時間に対して水平な直線の周りにランダムに分布していれば、仮定が満たされていると判断できます 27

この残差プロットと合わせて、統計的な検定も行われます。ここで注意すべき点は、この検定における帰無仮説は「比例ハザード性の仮定は満たされている」であるということです。したがって、私たちがこの検定で期待するのは、p値が「大きい」こと(例えば、0.05よりも大きいこと)です。p値が大きいということは、仮定が満たされているという帰無仮説を棄却するだけの証拠がない、ということを意味し、安心してCoxモデルの結果を解釈できることになります。これは、通常、小さなp値を求めて有意差を見つけようとする多くの統計検定とは逆の発想であり、特に注意が必要です。

では、もしこの比例ハザード性の仮定が満たされていないことが判明した場合はどうすればよいのでしょうか。その場合でも、分析を諦める必要はありません。対処法はいくつかありますが、代表的なものに「層別Cox回帰」という手法があります 25。これは、仮定を満たさない変数(例えば、年齢)で対象者全体をいくつかの層(例えば、「若年層」と「高齢層」)に分け、それぞれの層の中で別々にCoxモデルを適用する方法です。これにより、その変数の影響をモデルから切り離しつつ、他の変数の影響を評価することができます。

比例ハザード性の確認は、単なる手続き上の一ステップではありません。それは、自分が行う分析の信頼性を保証し、得られる結論の妥当性を支えるための、研究者としての責任ある行動なのです。

まとめ

本記事では、臨床研究をはじめとする多くの分野で極めて重要な役割を果たす生存時間解析について、その根幹をなす一連の手法と思考のプロセスを解説してきました。その分析の流れは、一貫した物語として要約することができます。

まず、私たちは「カプランマイヤー法」を用いて、イベント発生までの時間のデータを可視化し、生存の物語を曲線として描き出します。次に、その曲線間に見られる差が統計的に意味のあるものかどうかを「ログランク検定」によって科学的に検証します。しかし、現実世界の現象は多くの要因が複雑に絡み合って生じるため、単一の要因だけを見るだけでは不十分です。そこで、「Cox比例ハザード回帰モデル」という強力な多変量解析手法を用いることで、他の要因の影響を調整しながら、特定の要因がイベント発生のリスクに与える影響の大きさと方向性を「ハザード比」として定量化します。そして最後に、そのモデルの信頼性を担保するために、最も重要な前提である「比例ハザード性の仮定」が満たされているかを厳密に確認します。この一連のプロセスこそが、質の高い生存時間解析を支える骨格なのです。

さて、本記事の冒頭で触れたように、近年の人工知能(AI)技術の発展は、こうした複雑な統計解析の実行方法に大きな変革をもたらしています。AIコーディングアシスタントのようなツールは、専門的なプログラミング知識がなくとも、自然言語による指示だけで、論文に掲載できるような精緻なグラフや解析結果を生成することを可能にしつつあります。これにより、分析を実行するための技術的な障壁は劇的に低くなりました。

しかし、私たちはこの技術の進歩を前にして、極めて重要な事実を心に留めておかなければなりません。それは、AIがコードを生成し、計算を実行することはできても、その分析の根幹にある科学的な思考までを代替することはできない、ということです。

AIは、研究の目的を定義し、臨床的に意味のある問いを立てることはできません。どの変数をモデルに含めるべきか、どのグループを比較の基準とすべきかといった、文脈に基づいた判断を下すこともできません。そして何よりも、得られたハザード比が現実世界で何を意味するのかを深く解釈し、比例ハザード性のようなモデルの根本的な仮定の妥当性を評価し、その結果の限界を洞察するといった、批判的思考のプロセスは、依然として人間の研究者に委ねられています。

したがって、AIが分析の「方法(How)」を容易にしてくれるからこそ、私たち研究者は、その背景にある「理由(Why)」をこれまで以上に深く理解する責任を負うことになります。AIは、私たちの思考を加速させる強力なパートナーですが、私たちの知性の代替物ではありません。生存時間解析という強力なレンズを通して世界の真理を探究する旅において、最終的に頼れるのは、統計的なリテラシーと科学的な洞察力に裏打ちされた、私たち自身の知性です。

引用文献

  1. 生存時間解析で打ち切りデータを制す!【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】,  https://statg.com/oyo/sewa.html
  2. カプラン・マイヤー法(Kaplan-Meier method),  https://www.stats-guild.com/analytics/16041
  3. 生存時間解析とは?イベント発生までの時間を分析する手法を解説! - データアナリティクスラボ,  https://dalab.jp/mag/methods/survival_time_analysis/
  4. 医学統計勉強会 第7回 生存時間解析 - 帝京大学臨床研究センター,  医学統計勉強会 第7回 生存時間解析
  5. 医師のための統計学再入門:生存時間解析 - エピロギ,  https://epilogi.dr-10.com/articles/5624/
  6. カプランマイヤー曲線|医療統計|ビーリンサイト.jp,  https://www.blincyto.jp/documents/medical_statistics06
  7. ログランク検定とCox比例ハザード解析の違いの整理 - Statistics Doctor,  https://statistics-doctor.com/difference_between_log_rank_and_cox/
  8. カプランマイヤー曲線の書き方は?打ち切りの見方も簡単にわかりやすく | いちばんやさしい,  https://best-biostatistics.com/surviv/km.html
  9. カプランマイヤー法(3/3) :: 【公式】株式会社アイスタット|統計分析研究所,  https://istat.co.jp/sk_commentary/kaplan_meier_03
  10. 【これだけ知れば簡単理解】カプランマイヤー法(過去問108回 問194解説)【薬剤師国家試験予備校REC】 - YouTube,  https://www.youtube.com/watch?v=bLxPEfSDvb4
  11. カプランマイヤー法による生存曲線の例 - アイスタット,  https://istat.co.jp/sk_commentary/kaplan_meier
  12. 【生存時間解析】ログランク検定の実践【Part6】【統計検定準1級•1級】 - Syleir's note,  https://syleir.hatenablog.com/entry/2024/05/27/071224
  13. Log-rank検定/Cox回帰モデル|医療統計 - ビーリンサイト.jp,  https://www.blincyto.jp/documents/medical_statistics07
  14. www.blincyto.jp,  Log-rank検定/Cox回帰モデル|医療統計
  15. ログランク検定と一般化ウィルコクソン検定とは?p値やカプランマイヤー曲線の解釈,  https://best-biostatistics.com/surviv/logrank.html
  16. Cox 回帰分析(Cox Regression Analysis) | StatsGuild Inc.,  https://www.stats-guild.com/analytics/1252
  17. 【例題で解説】Cox比例ハザード回帰 - Staat,  https://corvus-window.com/all_cox-proportional/
  18. わかる統計教室 第4回 ギモンを解決!一問一答 質問8(その1) - Google Groups,  https://groups.google.com/g/shizuokahattatusig/c/Kjhckh8Ae-s
  19. ハザード比|医療統計 - ビーリンサイト.jp,  https://www.blincyto.jp/documents/medical_statistics08
  20. Cox比例ハザードモデルをわかりやすく解説!生存時間解析での多 ...,  https://best-biostatistics.com/surviv/cox.html
  21. ハザード比とは何ですか? - 免疫分析研究センター株式会社,  https://menekibunseki.com/faq/post-590/
  22. ハザード比(ハザードレシオ)の基本と医療統計における重要性 | 東京・ミネルバクリニック,  https://minerva-clinic.or.jp/academic/terminololgyofmedicalgenetics/hagyou/hr/
  23. ハザード比 - Wikipedia,  https://ja.wikipedia.org/wiki/%E3%83%8F%E3%82%B6%E3%83%BC%E3%83%89%E6%AF%94
  24. 比例ハザード性 | 統計用語集 | 統計WEB,  https://bellcurve.jp/statistics/glossary/1159.html
  25. 比例ハザード性とは?検証方法と成立しない場合の対処法もわかり ...,  https://best-biostatistics.com/surviv/hirei-hazard.html
  26. Cox比例ハザードモデル(Cox回帰)入門 #統計学 - Qiita,  https://qiita.com/nakey_tdse/items/b40238599395653a7965
  27. 比例ハザード性の仮定が成立しているか検証する[R] - ねこすたっと,  https://necostat.hatenablog.jp/entry/2021/09/29/075042

-生物学, 疫学, 統計学

© 2025 RWE