エビデンス全般 ビジネス全般 ビッグデータ 統計学

統計学の歴史:政治算術から科学への応用まで

2025年7月18日

私たちの周りの世界は、複雑で、予測が難しい出来事に満ちています。しかし、人間は太古の昔から、この混沌とした世界の中に何らかの秩序や法則性を見つけ出し、未来を少しでも予測したいという根源的な欲求を持ってきました。この尽きることのない知的好奇心こそが、自然科学や社会科学といった、あらゆる学問の種を蒔き、育ててきた原動力と言えるでしょう。そして、今日私たちが学ぶ「統計学」もまた、その豊かな土壌から芽吹いた学問の一つなのです。

社会で起こる様々な現象、雄大な自然が見せる気まぐれな表情、そして生命の神秘的な営み。これらの中に潜む法則を見つけ出そうとする試みは、科学そのものの営みです。統計学は、その中でも特に、データという客観的な証拠に基づいて、不確実性を含んだ現象を理解するための強力な言語であり、思考の道具として発展してきました。

この物語の始まりは、統計学という言葉がまだ「科学」の響きを持たなかった時代に遡ります。今日、私たちが「統計」という言葉を聞くと、人口統計や経済統計のように、国や社会の状態を数字で表したものを思い浮かべることが多いかもしれません。これは、統計学の最も古い姿、すなわち「記述統計」と呼ばれるものです。一方で、「統計学」という言葉には、より科学的で、数学的な分析を通じて物事の背後にある真理を探究するという、知的な探求のニュアンスが含まれます。

この二つの顔を持つ統計学の歴史を紐解くと、その語源が「国家(State)」や「状態(Status)」という言葉にあることに気づきます 1。これは偶然ではありません。統計学の最も初期の役割は、君主や為政者が自国の「状態」を把握し、富国強兵に役立てるための、いわば国家の自己診断ツールだったのです。今回は、そんな国家を記述するための「術」として生まれた統計が、いかにして確率論という数学的な翼を得て、やがては科学的な推論を行うための洗練された「学問」へと飛翔していったのか、その壮大な旅路を偉大な先人たちの足跡と共に辿っていきましょう。

国家を測る術

統計学の物語は、17世紀のヨーロッパで幕を開けます。この時代、絶対王政が確立され、国家間の競争が激化する中で、為政者たちは自国の力を正確に把握する必要に迫られていました。それは、単なる領土の広さや人口の多さといった漠然としたものではなく、より具体的で、比較可能な「国力」の指標でした。この要請に応える形で、世界を数字で捉えようとする新しい知の潮流が生まれます。

政治算術の誕生 ― ウィリアム・ペティ

この新しい潮流の先駆けとなった人物が、イングランドの医師であり、経済学者でもあったウィリアム・ペティです。彼は、当時の哲学やレトリックに満ちた議論とは一線を画す、画期的な方法を提唱しました。それは、あらゆる事象を「数と量と尺度によって」語るという、徹底した数量主義でした 2。ペティはこの新しい知の方法を「政治算術(Political Arithmetick)」と名付け、国家という複雑な存在を、あたかも解剖学者が人体を解き明かすように、客観的なデータで分析しようと試みたのです 3

彼の医師としての経歴は、このアプローチに色濃く反映されています。ペティは、国家を一つの生命体と捉え、その健康状態や体力を診断する「政治的解剖(Political Anatomy)」を試みました 3。彼の主著である『政治算術』は、まさにその実践例です。この著作でペティは、当時のライバル国であったイングランドとフランスの国力を、人口、税収、貿易額などの具体的な数値データを駆使して比較し、領土や人口で劣るイングランドが、実はフランスよりも優位にあることを論証しようとしました 4

これは単なる学術的な探求ではありませんでした。彼の目的は、自国の王や内外のライバルに対して、イングランドの潜在的な力を数字という動かぬ証拠で示すこと、つまり、統計を政治的な説得の武器として用いることにありました。彼の息子が国王に宛てた献辞には、この書が「算術の普通の法則によって」国王の栄光と人民の幸福を証明していると記されており、データが特定の政治的物語を補強するために用いられたことが窺えます 7

もちろん、当時のデータ収集には限界があり、彼の推計は現代の基準から見れば粗削りな部分も多くありました。例えば、炉端税の台帳のような断片的な記録から、サンプル調査的な手法を用いて総人口を推計するなど、限られた情報から全体像を導き出すための工夫を凝らしてはいましたが、その正確性には危うさが伴いました 7。しかし、重要なのはその精度よりも、社会や国家を客観的な数量データに基づいて理解し、議論するという新しい「知の作法」を提示した点にあります。ペティの時代、経済学と統計学はまだ分かれておらず、彼の「政治算術」は、両分野を含む社会科学そのものの萌芽であったと言えるでしょう 4

国勢学の体系化 ― ゴットフリート・アッヘンヴァル

ペティがイングランドで数量的なアプローチを切り拓いていた頃、大陸のドイツでは、また異なる形で国家を理解しようとする学問が体系化されつつありました。その中心人物が、ドイツの学者ゴットフリート・アッヘンヴァルです。彼の功績は、今日私たちが使う「統計学(Statistik)」という言葉を学問の世界に定着させたことにあります 8

しかし、アッヘンヴァルが提唱した「Statistik」は、ペティの「政治算術」とはその趣を異にしていました。彼が体系化したのは「国勢学(Staatenkunde)」とも呼ばれる学問で、その目的は、国家に関する包括的で体系的な知識を記述することにありました 8。彼の主著『ヨーロッパ諸国の構造概要』が示すように、その内容は国の地理、政治体制、法制度、農業、工業、商業といった多岐にわたる項目を網羅し、国家の全体像を文章で描き出す、いわば百科事典的な性格を持っていました 12

ここには、初期の統計学が二つの異なる道を歩んでいたことが示されています。一つは、ペティに代表されるイギリスの「政治算術」の系譜で、数量的、論証的であり、数字を武器に国力を比較・測定することに主眼を置いていました。もう一つが、アッヘンヴァルに代表されるドイツの「国勢学」の系譜で、体系的、記述的であり、国家の構造を総合的に理解することを目指していました。後者は、当初は必ずしも数字を重視せず、文章による詳細な記述が中心でした 10

どちらが「統計学の父」であるかについては、イギリスとドイツの間で長らく議論が交わされてきましたが 12、この二つの潮流は、統計学が持つ「記述」と「分析」という二つの側面を象徴していると考えることができます。アッヘンヴァルの貢献の真髄は、彼の方法論そのものよりも、「Statistik」という学問分野に名前を与え、大学で教えられるべき正式な学問としての地位を確立した点にあるのかもしれません 11。彼が掲げた「Statistik」という旗の下に、やがてペティ流の数量的な手法が合流し、統計学は新たな発展の時代を迎えることになるのです。

確率と法則性の探求

国家を記述する「術」として始まった統計学が、科学的な「学問」へと飛躍するためには、もう一つの強力な要素が必要でした。それは、偶然や不確実性といった、人間の目には混沌と映る現象を数学的に扱うための道具、「確率論」です。天体の運行という壮大な秩序から、人間の営みというミクロな現象まで、その背後に潜む法則性を探求する知の冒険が始まります。

天上の法則から地上の確率へ ― シモン・ラプラス

この変革の時代に、巨大な知性の光を放ったのが、フランスの天文学者であり数学者のシモン・ラプラスです。彼の主戦場は天体力学という宇宙の法則を探る学問でしたが、彼が確率論の分野で打ち立てた金字塔は、遠く離れた地上の学問である統計学の運命を永遠に変えることになりました。

彼の主著『確率論の解析理論』は、それまで賭博の数学として扱われがちだった確率論を、一つの洗練された数学理論へと昇華させた記念碑的な著作です。この中で彼が示した多くの定理の中でも、統計学にとって最も重要な贈り物となったのが、「中心極限定理」として知られる考え方です。

この定理を数式を使わずに説明するならば、それはまるで魔法のような法則です。例えば、ある集団から無作為に標本(サンプル)をいくつか取り出して、その平均値を計算するという作業を何度も繰り返したとします。このとき、元の集団がどのような形の分布(例えば、サイコロの目のように一様であったり、何らかの偏りがあったり)をしていようとも、集めた標本の平均値の分布は、標本の数が増えるにつれて、必ず左右対称の美しい「正規分布」、つまり釣鐘型の曲線に近づいていくのです 13

この中心極限定理の発見は、統計学にとって革命的な意味を持ちました。それは、未知で巨大な母集団全体を調べなくても、そこから取り出した一部分である標本を調べるだけで、母集団の性質についてかなり正確な推測ができるという、推測統計学の理論的な土台を築いたからです。選挙の出口調査で、わずか数千人の有権者の声から全体の投票結果を予測できるのも、この定理のおかげなのです 16。中心極限定理は、いわば、私たちが手にする小さな「標本」という断片的な言葉を、知りたい対象である「母集団」全体の言葉へと翻訳してくれる、魔法の「ロゼッタ・ストーン」のような役割を果たしているのです。

ラプラス自身は、もし宇宙のすべての粒子の位置と運動量を知ることができれば、未来は完全に予測可能であると考える、厳格な決定論者でした。彼にとって確率は、真の偶然性ではなく、人間の知識の不完全さを表す尺度に過ぎませんでした。しかし皮肉なことに、彼が人間の無知を克服するために磨き上げた確率論の道具は、後にケトレーのような社会学者によって人間社会の分析に応用され、星々の運行を支配する数学的法則が、人間社会の営みの中にも見出せるという、新しい世界観への扉を開くことになったのです。

誤差に潜む真実 ― カール・フリードリヒ・ガウス

ラプラスが確率論の理論的な大伽藍を築き上げていた頃、ドイツには「数学の王子」と称される天才、カール・フリードリヒ・ガウスが登場します。彼は、天文学の観測データに含まれる「誤差」という厄介な問題を、逆に真実に迫るための手がかりへと変える、驚くべき発想の転換を成し遂げました。

その才能を物語る有名な逸話が、準惑星「ケレス」の再発見です。1801年、発見されたばかりのケレスは、わずかな期間観測された後、太陽の向こうに隠れて見失われてしまいました。当時の天文学者たちがその軌道を再計算できずに途方に暮れる中、ガウスは限られた不正確な観測データだけを頼りに、独創的な計算手法を編み出してケレスの軌道を予測し、見事その再発見に貢献したのです 18

この時に彼が用いたのが、「最小二乗法」として知られる手法です。これは、観測されたデータ点と、予測される理論上の線(例えば直線)との間の「誤差」の二乗の合計が、最も小さくなるように理論上の線を描くという方法です 19。ばらつきのあるデータの中から、最も「ありそうな」真の姿をあぶり出すための、強力な道具でした。

ガウスの真の洞察は、この実用的な計算手法と、ラプラスも研究していた「正規分布」とを結びつけた点にあります。彼は、観測に伴う誤差が、多くの場合、この釣鐘型の正規分布に従うことを見抜きました。そして、最小二乗法は、まさにこの「誤差が正規分布に従う」という仮定の下で、数学的に最も優れた(最も確からしい)推定値を与える方法だったのです 19。誤差はもはや単なる間違いではなく、正規分布という予測可能な構造を持つ現象として捉えられました。その構造を理解することで、ノイズの中からシグナルを分離し、真の値に迫ることが可能になったのです。

この功績から、正規分布はしばしば「ガウス分布」とも呼ばれます 22。ラプラスの中心極限定理が、なぜ自然界や社会現象のデータに正規分布が頻繁に現れるのかという理論的な「なぜ」を説明したとすれば、ガウスの最小二乗法は、その正規分布の性質を利用して、誤差を含んだデータからいかにして真の値を推定するかという実践的な「どのように」を解決したと言えるでしょう。この二人の天才の業績は、いわば車の両輪のように組み合わさり、観測データから科学的な結論を導き出すという、近代統計学の力強いエンジンを形成したのです。

社会の物理学と「平均人」 ― アドルフ・ケトレー

ラプラスとガウスが鍛え上げた確率論と誤差理論という強力な武器を、初めて人間社会そのものに体系的に向けた人物が、ベルギーの天文学者であり統計学者であったアドルフ・ケトレーです。彼は「近代統計学の父」とも称され、その野心は、ニュートンが物理法則で天体の運行を解明したように、統計法則によって社会の動きを解明する「社会物理学」を創設することにありました。

ケトレーの最も画期的な功績は、犯罪、結婚、自殺といった、個人の自由意志に基づくと思われる人間の行動が、社会全体として見ると驚くほど安定した発生率を示すことを発見した点です。彼は、これらの社会現象が、あたかも物理法則のように、予測可能な統計的規則性に従うことを明らかにしました。これは、社会を単なる個人の寄せ集めとしてではなく、それ自体が独自の法則性を持つ一つのシステム、あるいは生命体として捉える新しい視点の誕生を意味していました。

この「社会という生命体」を象徴する概念として、ケトレーは「平均人(l'homme moyen)」という独創的なアイデアを提唱しました 23。平均人とは、実在する特定の個人ではなく、ある社会に属する人々の身体的、知的、道徳的な特徴の平均値をすべて兼ね備えた、統計上の仮想的な存在です。ケトレーにとって、この平均人は、物体の「重心」のようなものであり、社会の均衡と運動を評価するための中心点、そしてあらゆる個人がそこからどれだけ離れているかを測る基準となるべきものでした 24

彼のこの考え方は、今日私たちが日常的に使っている肥満度指数、BMI(Body Mass Index)にもその痕跡を残しています。もともと「ケトレー指数」と呼ばれていたこの指標は、まさに人間の身体的特徴を数量化し、平均と比較しようとする彼の思想から生まれた具体的な産物なのです。

しかし、ケトレーの「平均人」という概念は、統計学の未来に重要な問いを投げかけることにもなりました。社会全体の規則性を明らかにすることに成功した一方で、その「平均」からの「ばらつき」、すなわち個人の多様性や非凡な才能の価値を、ある意味で見過ごす危険性も孕んでいたのです。彼の研究が社会の「安定性」に光を当てたことで、次世代の統計学者たちは、逆にその安定からの「逸脱」、すなわち「変動」そのものに強い関心を抱くようになります。ケトレーが築いた「平均」という礎石の上に、次なる統計学の新しい章が始まろうとしていました。

変異と関係性の記述

ケトレーによって社会の「平均像」が描き出された後、統計学の舞台はイギリスへと移り、その関心は「平均」から「ばらつき」へと大きく転換します。ダーウィンの進化論が知の世界を席巻する中、生物の個体差や遺伝といった「変異」のメカニズムを解明することが、時代の大きな課題となっていました。この課題に応えるため、イギリスの生物測定学派は、変数間の「関係性」を記述するための新しい統計手法を次々と開発していきます。

遺伝と「平均への回帰」 ― フランシス・ゴルトン

この新しい時代の扉を開いたのは、探検家、人類学者、そして遺伝学者と、多彩な顔を持つフランシス・ゴルトンでした。彼は進化論の提唱者チャールズ・ダーウィンの従兄であり、その知的好奇心は、人間の才能や形質がどのように遺伝するのかという問題に強く向けられていました。彼の研究は、優れた形質を持つ人間同士を交配させることで社会を改良しようとする「優生学」という、今日では大きな批判を受ける思想に動機づけられていました 25。しかし、この研究の過程で彼が発見した統計的な法則は、彼の当初の意図を超えて、統計学そのものを大きく前進させることになります。

ゴルトンは、親と子の身長の関係を調べる中で、一つの奇妙な現象に気づきました。それは、非常に背の高い親から生まれた子供は、確かに平均よりは背が高いものの、親の身長ほどは高くならず、集団全体の平均身長に少し近づく傾向がある、というものでした。逆もまた真なりで、非常に背の低い親から生まれた子供は、親よりは背が高くなる傾向がありました 26。彼はこの、極端な形質が世代を経るごとに平均的な状態に「後戻り」する現象を、「平均への回帰」と名付けました 28

この発見は、ゴルトンにとって大きなパラドックスでした。彼は優れた才能がそのまま子孫に受け継がれることを証明しようとしていたのに、彼自身のデータは、自然界には極端な形質を穏やかにする力が働いていることを示していたのです。この発見は、彼が信奉した単純な優生学の思想の限界を示唆するものでもありました 29

しかし、この探求は統計学に二つの偉大な概念をもたらしました。「相関」と「回帰」です。彼は、二つの変数(例えば親の身長と子の身長)がどの程度連動して変化するかを数量的に示す「相関係数」のアイデアを生み出し 30、一方の変数の値からもう一方の変数の値を予測するための「回帰分析」という手法の基礎を築きました 32。彼が相関係数を表すために用いた記号「r」は、回帰(regression)の頭文字に由来し、今日でも広く使われています 32

ゴルトンは、ケトレーが注目した「平均」という一点から、データの「ばらつき」と変数間の「関係性」という、よりダイナミックな世界へと統計学の視野を広げました。彼の関心は個々の差異にあり、その差異を記述し、予測するための新しい言語を統計学に与えたのです。

数理統計学の礎 ― カール・ピアソン

フランシス・ゴルトンが直感的かつ独創的に切り拓いた道を、厳密な数学の言語で舗装し、壮大な学問体系へと築き上げたのが、彼の後継者であるカール・ピアソンでした。ピアソンは、ゴルトンの遺産によって設立された大学の優生学部の初代教授となり、師の思想を受け継ぎながらも、その統計的手法を比類なきレベルで精緻化・体系化しました。彼こそが、現代につながる「数理統計学」を実質的に創始した人物と言えるでしょう。

ピアソンの貢献は多岐にわたります。彼は、ゴルトンが概念的に捉えていた相関係数に、今日私たちが用いる厳密な数学的定義を与えました 33。また、データのばらつきを表す重要な指標である「標準偏差」という言葉を導入し、度数分布を視覚化するための「ヒストグラム」というグラフを考案したのも彼です 34

しかし、彼の数ある業績の中でも特に画期的なのが、「カイ二乗検定」の発明です 35。これは、統計学の歴史における一つの分水嶺でした。この検定法によって、研究者は初めて、手元にある観測データが、自分の立てた理論的な仮説(例えば、データが正規分布に従うという仮説)とどの程度「適合」しているのかを、客観的な確率で評価できるようになったのです 36。これは、単にデータを記述する段階から、データに基づいて科学的な仮説を検証するという、本格的な「推測」の段階へと統計学が足を踏み入れたことを意味します。

ピアソンは、師であるゴルトンや同僚の生物学者ウォルター・ウェルドンと共に、雑誌『バイオメトリカ(Biometrika)』を創刊し、生物学的な問題、例えばカニの甲羅のサイズの分布が正規分布にどれだけ当てはまるかといった研究に、これらの新しい統計手法を精力的に応用しました 38。彼ら生物測定学派は、ダーウィンの進化論を数学的に裏付けるという壮大な目標を掲げ、統計学を一つの強力な研究プログラムへと組織化していきました 40

ピアソンは、ゴルトンのひらめきに数学的な骨格を与え、統計学を記述の科学から検証の科学へと変貌させました。彼が築いた数理統計学という堅固な礎の上に、20世紀の統計学はさらなる発展を遂げることになります。

標本から母集団を推し量る

20世紀に入ると、統計学の主戦場は、より実践的な問題解決の領域へと広がっていきます。産業界や農業試験場といった現場では、大規模なデータではなく、限られた数の標本からいかにして信頼性の高い結論を導き出すかという、切実な課題が待ち受けていました。この課題に応える形で、現代の推測統計学の洗練された枠組みが構築されていきます。

小標本の声を聞く ― ウィリアム・ゴセット

この新しい時代の要請に、ユニークな形で応えたのが、アイルランドのギネス醸造所で働いていた化学者、ウィリアム・ゴセットです。彼は、カール・ピアソンの研究室で学んだ経験を持ちながらも、学問の世界から離れ、ビールの品質管理という実務の最前線にいました。

彼が直面した問題は、極めて実践的なものでした。それは、新しい品種の大麦がビールの品質向上に本当に役立つのかを判断するために、どのくらいの試作を行えばよいか、という問題です。醸造には時間もコストもかかり、ピアソンたちが扱っていたような大規模なデータを集めることは不可能です。彼は、ごく少数の標本(サンプル)から、母集団全体(その大麦を使って醸造した場合に得られるであろうビールの品質)について、信頼できる結論を導き出す方法を必要としていました 41

しかし、ピアソンが確立した統計手法は、標本の数が十分大きいことを前提とした「大標本理論」であり、ゴセットが扱うような小さな標本にはうまく適用できませんでした 41。そこで彼は、この「小標本問題」を解決するため、独力で研究に取り組みます。そして、標本の数が少ない場合に特有の不確実性を考慮に入れた、新しい確率分布を発見しました。これが、今日「t分布」として知られるものです。このt分布を用いることで、彼は小標本であっても信頼性の高い検定を行う手法、すなわち「t検定」を編み出したのです 43

ゴセットのこの画期的な業績は、しかし、彼自身の名前で発表されることはありませんでした。ギネス社が醸造に関する企業秘密の漏洩を恐れ、社員による論文発表を禁じていたためです。そこで彼は、「スチューデント(Student)」というペンネームを用いて、その歴史的な論文を発表しました。このため、t検定は今なお「スチューデントのt検定」という名で親しまれています。

ゴセットの業績は、統計学を一部の専門家の手から、広く一般の科学者や技術者の手に解放する「民主化」の役割を果たしました。t検定というシンプルで強力な道具は、実験室や工場といった、限られたリソースの中で真実を探求するすべての人々にとって、かけがえのない福音となったのです。彼は、大標本理論の時代を築いたピアソンと、次に登場する実験計画法の巨人フィッシャーとを結ぶ、極めて重要な架け橋となりました。

現代統計学の設計者 ― ロナルド・フィッシャー

20世紀の統計学の歴史において、もし一人の最も重要な人物を挙げるとすれば、それは間違いなくロナルド・フィッシャーでしょう。彼は、ゴセットが切り拓いた小標本理論をさらに発展させ、統計的推論と実験計画という二つの分野を統合し、現代統計学の壮麗な建築物を設計した「偉大な建築家」でした。

フィッシャーの活躍の舞台は、イギリスのロザムステッド農事試験場でした。ここでもまた、彼の革新は実践的な課題から生まれています。それは、どの肥料が、あるいはどの品種の小麦が、本当に収量を増やすのかを、天候や土壌の不均一性といったノイズの中から、いかにして正確に見極めるかという問題でした。

この課題に対するフィッシャーの答えは、単なる新しい分析手法の発明にとどまりませんでした。彼は、信頼できる結論を得るためには、データを集めた後の「分析」だけでなく、データを集める前の「計画」こそが重要であると考えたのです。これが「実験計画法(Design of Experiments)」という、彼の最も深遠な貢献です。彼は、科学的な実験が従うべき三つの基本原則を提唱しました 44

第一に「反復」。同じ条件の実験を複数回繰り返すことで、偶然によるばらつきの大きさを評価します 46。第二に「無作為化(ランダム化)」。どの区画にどの肥料をまくかなどを無作為に割り付けることで、研究者が気づいていない未知の要因による偏り(バイアス)を防ぎます 46。そして第三に「局所管理」。隣接する似た条件の区画を一つのブロックとしてまとめ、その中で比較を行うことで、場所による影響を最小限に抑えます 46

この実験計画法という哲学は、統計学の役割を、すでに集められたデータを後から受動的に分析する学問から、良質なデータを生み出すために実験そのものを能動的に設計する学問へと、根本的に変革しました。そして、この計画法によって得られたデータを分析するための強力な道具として、彼は「分散分析(ANOVA)」を開発しました。これは、t検定を拡張し、3つ以上のグループを同時に比較したり、複数の要因(肥料の種類や品種など)が互いにどう影響し合うかを分析したりすることを可能にする画期的な手法でした 48

フィッシャーは、ゴセットの小標本理論、ピアソンの相関分析、そして自身の推定理論や実験計画法を、一つの首尾一貫した体系へと見事に織り上げました。彼が設計したこの知的体系は、今日の科学研究のあらゆる分野で、その基本設計として生き続けています。

見えないものを観る ― エイブラハム・ワルド

統計学の偉人たちを巡る旅の最後に登場するのは、その思考の鋭さで、統計的推論が到達しうる深みを示した数学者、エイブラハム・ワルドです。彼の業績は、データ分析において最も重要なことは、時に複雑な計算ではなく、手元にあるデータが「どのようにして生まれたのか」を深く洞察し、そして「そこに見えていないものは何か」を問うことであると教えてくれます。

そのことを示す最も有名な逸話が、第二次世界大戦中の戦闘機に関する物語です。当時、アメリカ軍は、ヨーロッパの戦線から帰還した爆撃機の損傷を最小限に抑える方法を模索していました。軍の分析官たちは、帰還した機体の被弾箇所を詳細に調査し、翼や胴体など、弾痕が集中している部分の装甲を強化すべきだと提案しました 49。これは、手元にあるデータに基づいた、一見すると極めて合理的な判断でした。

しかし、この問題の諮問を受けたワルドは、全く逆の結論を導き出します。彼は、分析官たちが見落としている致命的な点、すなわち、そのデータが「生還した機体」のみから得られたものであるという点に気づきました。帰還した機体の弾痕マップには、コックピットやエンジンといった重要な部分に、ほとんど弾痕がありませんでした。ワルドの天才的な洞察は、これが「それらの部分が頑丈だから弾を弾いた」のではなく、「それらの部分に被弾した機体は、そもそも基地に帰還できなかった」からである、と見抜いたことにあります 49

つまり、データの中に存在しない「弾痕のない場所」こそが、機体にとっての真の弱点だったのです。彼の勧告は、したがって「帰還した機体で損傷していない部分を強化せよ」という、直感に反するものでした 50。これは、統計学で「生存者バイアス」として知られる罠を、見事に喝破した例です。

ワルドのこの逸話は、統計的思考の真髄を私たちに教えてくれます。それは、数字の背後にある文脈を読み解き、見えているデータだけでなく、見えていないデータの存在に思いを馳せる、知的な想像力です。ペティが目に見えるものを数えることから始めた統計学の旅は、ついに、ワルドによって、目に見えないものを論理的に推論するという、最も洗練された高みへと到達したのです。

記述から推測、そしてこれから

ウィリアム・ペティが「政治算術」で国家の力を測ろうと試みた17世紀から、エイブラハム・ワルドが「見えない弾痕」から戦闘機の弱点を見抜いた20世紀まで、私たちは統計学が歩んできた壮大な知的冒険の道のりを辿ってきました。その道のりは、単なる技術の進歩の歴史ではありません。それは、人間が不確実な世界と向き合い、混沌の中から意味を読み解こうとする、思考様式そのものの進化の物語でした。

国家の「状態(Status)」を記述することから始まった統計(Statistics)は、ラプラスとガウスによって確率論という数学的な翼を授けられ、空へと舞い上がりました。ケトレーは、その翼を用いて人間社会の上空を飛び、「平均人」という社会の重心を発見しました。ゴルトンとピアソンは、さらに深く潜り、個々の「ばらつき」や変数間の「関係性」という、生命の多様性の海を探検しました。そして、ゴセット、フィッシャー、ワルドといった20世紀の開拓者たちは、限られた標本という小舟から、母集団という広大な大海の姿を推し量るための、精緻な航海術を完成させたのです。

この偉大な先人たちが残してくれた概念、すなわち「平均への回帰」や「相関係数」、「t検定」、そして「実験計画法」といった考え方は、もはや歴史的な遺物ではありません。それらは、現代の科学研究、ビジネスにおけるデータ分析、そして私たちが日々情報に接する際の思考のOSとして、深く組み込まれています。

統計学の歴史を学ぶことは、過去の偉業を知識として知ること以上の意味を持ちます。それは、彼らがどのように問いを立て、どのようにデータと格闘し、そしてどのようにして真実に迫っていったのか、その思考のプロセスを追体験することです。先達の足跡を一歩一歩追っていくことで、私たちは、データに溢れた現代社会をより賢く、より深く理解するための指針を手にすることができるでしょう。そして、その指針は、私たちがこれから進むべき、まだ見ぬ未来への道筋をも照らし出してくれるに違いありません。

引用文献

  1. Definitions and Characteristics of Statistics Homework Help in Statistics - Homework1.com, https://homework1.com/statistics-homework-help/definitions-and-characteristics/
  2. 政治算術(せいじさんじゅつ)とは? 意味や使い方 - コトバンク, 政治算術(せいじさんじゅつ)とは? 意味や使い方 - コトバンク
  3. 政治算術, https://qmss.ne.jp/qmss/text/supplements/petty.htm
  4. oisr-org.ws.hosei.ac.jp, ウィリアム・ペティ著 政治算術数論 |
  5. ウィリアム・ペティ著 政治算術数論 | - 大原社会問題研究所, https://oisr-org.ws.hosei.ac.jp/public/exhibition/rare/petty18/
  6. ウィリアム・ペティの政治算術( 3), ウィリアム・ペティの政治算術( 3)
  7. 「政治算術」の世界, https://www.let.osaka-u.ac.jp/seiyousi/vol_1/pdf/vol_1_article01.pdf
  8. Gottfried Achenwall | Encyclopedia.com, https://www.encyclopedia.com/science/encyclopedias-almanacs-transcripts-and-maps/gottfried-achenwall
  9. Statistics is (Literally) Statecraft - Conversable Economist, https://conversableeconomist.com/2024/04/12/statistics-is-literally-statecraft/
  10. Statistics as a Form of Knowledge - Public Seminar, https://publicseminar.org/essays/statistics-as-a-form-of-knowledge/
  11. The Quantifying Spirit in the 18th Century "d0e17823" - UC Press E-Books Collection, https://publishing.cdlib.org/ucpressebooks/view?docId=ft6d5nb455;chunk.id=d0e17823;doc.view=print
  12. Gottfried Achenwall - Wikipedia, https://en.wikipedia.org/wiki/Gottfried_Achenwall
  13. 正規分布の発見, http://www.math.s.chiba-u.ac.jp/~yasuda/statA/072.pdf
  14. 正規分布の公式と特徴まとめ - AVILEN, https://avilen.co.jp/personal/knowledge-article/normal-distribution/
  15. 中心極限定理の歴史, http://www.math.s.chiba-u.ac.jp/~yasuda/statB/clt-hist.pdf
  16. 中心極限定理とは?具体例で丁寧に解説, https://data-viz-lab.com/chusinkyokugenteiri
  17. 中心極限定理 - Wikipedia, 中心極限定理 - Wikipedia
  18. ガウス(がうす)とは? 意味や使い方 - コトバンク, https://kotobank.jp/word/%E3%81%8C%E3%81%86%E3%81%99-1521577
  19. 最小二乗法は誤差を正規分布と仮定した最尤推定である | ガットですりおろされたい大根のブログ, https://oroshi.me/2021/01/lsm
  20. ガウスと正規分布|アルゴリズムの歴史 - Zenn, https://zenn.dev/masahiro_toba/books/4d3bb178838675/viewer/f13df5
  21. 最小二乗法と最尤法 | NHN テコラス Tech Blog | AWS、Google Cloudなどのインフラ技術ブログ, https://techblog.nhn-techorus.com/archives/5206
  22. 科学史から最小二乗法 (回帰分析) を説明してみる - ill-identified diary, https://ill-identified.hatenablog.com/entry/2015/05/03/001326
  23. 「社会物理学」とはどのような学問か。また - レファレンス協同データベース, https://crd.ndl.go.jp/reference/entry/index.php?page=ref_view&id=1000057762
  24. A、ケトレーの「平均人」について, A、ケトレーの「平均人」について
  25. 【ゴールトンの遺伝から統計への道:相関・回帰の奇跡】#ゴールトン #相関 #回帰 #Shorts - YouTube, 【ゴールトンの遺伝から統計への道:相関・回帰の奇跡】#ゴールトン #相関 #回帰 #Shorts - YouTube
  26. フランシス・ゴルトンと「優生学」「平均への回帰」「人格論」 - カウンセリングしらいし, https://s-counseling.com/francis-galton/
  27. 統計学に関する逸話 - 2025 - セイコンサルティンググループ, 統計学に関する逸話 | セイコンサルティンググループ
  28. データサイエンス・スクール/ビジネスに役立つ統計講座・未来がわかる方程式, https://www.stat.go.jp/dss/course/701.html
  29. 優生学をこの世に産み落とした男、フランシス・ゴルトン - 成年者向けコラム, https://shohgaisha.com/column/grown_up_detail?id=2756
  30. フランシス・ゴルトン, https://navymule9.sakura.ne.jp/Francis_Galton.html
  31. ゴールトンとは? 意味や使い方 - コトバンク, ゴールトンとは? 意味や使い方 - コトバンク
  32. フランシス・ゴルトン - Wikipedia, フランシス・ゴルトン - Wikipedia
  33. gihyo.jp, 人物でつづる統計学 : 新刊ピックアップ | 技術評論社
  34. 人物でつづる統計学 : 新刊ピックアップ | 技術評論社 - gihyo.jp, https://gihyo.jp/book/pickup/2015/0035
  35. カイ二乗検定のわかりやすいまとめ - AVILEN, https://avilen.co.jp/personal/knowledge-article/chi-square-test/
  36. ABテスト(カイ二乗検定)で使われる「"ピアソンの"カイ二乗値」と「カイ二乗値」の違いを理解・検証する【ピアソンのカイ二乗値の分母が期待度数である理由】 - Qiita, https://qiita.com/Ringa_hyj/items/63270dda31e5f4ebb588
  37. ピアソンのカイ二乗検定とは - 統計を簡単に学ぶ, https://ja.statisticseasily.com/glossario/what-is-pearsons-chi-square-test/
  38. ピアソン(ぴあそん)とは? 意味や使い方 - コトバンク, ピアソン(ぴあそん)とは? 意味や使い方 - コトバンク
  39. 第8回 ピアソンが築いたパラメトリック統計学の礎石 - 統計の落とし穴と蜘蛛の糸 - Smart Lab Life, https://www.yodosha.co.jp/smart-lab-life/statics_pitfalls/statics_pitfalls08.html
  40. 近代数理統計学史 カール・ピアソン - CORE, https://core.ac.uk/download/pdf/236033768.pdf
  41. 統計で疲れたらビールで乾杯?! スチューデントのt検定とギネス ..., https://psych.or.jp/interest/mm-17/
  42. スチューデントのT検定の逸話 - 2025 - セイコンサルティンググループ, スチューデントのT検定の逸話 | セイコンサルティンググループ
  43. 小標本問題と t検定 - ほくそ笑む - はてなブログ, https://hoxo-m.hatenablog.com/entry/20130213/p1
  44. 【第12回】AIで再注目を浴びるフィッシャーの「実験計画法」 - 志士奮迅, 【第12回】AIで再注目を浴びるフィッシャーの「実験計画法」 | 志士奮迅
  45. saycon.co.jp, フィッシャーの三原則とは? | セイコンサルティンググループ
  46. 31-1. フィッシャーの3原則 | 統計学の時間, https://bellcurve.jp/statistics/course/12744.html
  47. 実験計画法におけるFisherの3原則(DS検定に頻出!)|CO-WRITE - 株式会社GRI, https://gri.jp/media/entry/7173
  48. 「実験計画法」とは - ものづくりドットコム, 「実験計画法」とは、キーワードからわかりやすく解説
  49. 「生存バイアス」を有名にした統計学者のエイブラハム ... - GIGAZINE, https://gigazine.net/news/20230219-abraham-wald/
  50. 生存者バイアス - Wikipedia, 生存者バイアス - Wikipedia
  51. 知っておきたい 「生存者バイアス」の考え方 日刊自記事から抜粋 - 越谷フェンダー, https://www.renovate.jp/5511/

-エビデンス全般, ビジネス全般, ビッグデータ, 統計学

© 2025 RWE