データサイエンスは、いまやバズワードの域を超えて定着しつつある言葉の1つです。
そして、コロナ禍を通じて大きく進化し、またその課題もより具体的なレベルに深化してきたとも言えます。
様々な角度から振り返ってみましょう。
- COVID-19の追跡
- COVID-19関連アプリの開発
- データサイエンティストと疫学者
- 既存モデルによる予測の限界
- コロナ禍の犯罪とデータサイエンス
- コロナ禍の教育とデータサイエンス
Table of Contents
COVID-19の追跡
データサイエンスとコロナ禍を考えたとき、まず思いつくのは「COVID-19の追跡」あるいは「感染状況の把握」でしょう。
感染状況を追跡することを通じて、新型コロナウイルスに関する様々な情報を得ることができました。
- 感染してから発症するまでの潜伏期間の情報
- 各地域、各時期におけるCOVID-19の有病割合(有病率)
潜伏期間の情報は、どの程度の間、他者との接触を避けることに注力するべきかの意思決定に役立ったでしょう。
また、いつ・どこに、どの程度の感染者がいるのかという情報は、ワクチンや治療薬供給の判断材料に用いられたと思われます。
このように、「意思決定のために情報を用いる」という意味で、データサイエンスはコロナ禍への対処に使われることとなりました。
もちろん、こうした取り組みは平時でも行われていますが、それがより顕著に、多くの人にわかりやすく実施されていたのが特徴です。
COVID-19関連アプリの開発
COCOAのような接触確認アプリから、新型コロナワクチン接種証明書アプリ、あるいは遠隔診療のアプリやシステムの開発も加速しました。
最初から全てうまく行くとは思えませんが、いくつかのアプリは実用に耐えうるところまで来ているのも事実でしょう。
接種証明書アプリにより紙依存体質からの脱却の第一歩が進み、遠隔診療アプリによって原則対面主義とは異なる立場も勢いをつけ始めています。
接触確認アプリについては、その機能自体もさることながら、データ活用とプライバシーの問題をより身近にしたという点でも有意義なものでしょう。
データサイエンティストと疫学者
興味深い変化もいくつか生じています。例えば、データサイエンティストが疫学的な活動に入り込み始めた点です。
この動きは、民間企業でも、公的機関でも見られました。
自分の組織において、メンバーの感染状況の把握は死活問題です。
当然ながら、感染者は少なくとも一定期間、業務にあたることができないためです。
そのため、組織の持続性や予見性と高めるために、自組織内の感染者の発生パターンを予測し対処することが求められました。
わざわざ研究として実施する必要はありませんが、それでも行っているのは「自組織内における感染者の発生パターンの予測」という、疫学的な取り組みになります。
学問的な一般化された知見を得る必要はありませんが、自組織の運営に可能な限り適合した予測モデルが求められているのは確かです。
そして、その予測モデル構築には、データサイエンティストのような役割と、疫学者のような役割の双方が求められます。
既存モデルによる予測の限界
コロナ禍で浮き彫りになったのが「既存モデルによる予測の限界」です。
結果を見れば明らかですが、パンデミック前に開発された予測モデルは、ほとんどの場合に有効ではありませんでした。
なぜでしょうか。
予測には条件設定が必要です。
ところが、その条件が過去と比べて大きく変わってしまった、そして今なお変わり続けているためです。
これはデータサイエンティスト泣かせでもあります。
背景が変わってしまうというのは、収集されるデータの意味自体が変わってしまっているとも言えます。
結果として、数年後の予測というものが意味をなさなくなってしまいました。
その一方で、むしろ統計の基本である現状分析、記述統計などに立ち返る風潮が強まりました。
予測するにしても、数年後のような長期スパンではなく、数日後や数分後といった非常に短いスパンの予測が好まれるようになっています。
短期的な予測を細かく迅速に繰り返すという方法に切り替わってきているということですね。
もちろん、将来の様々なシナリオを長期的スパンで想定して備えることの価値が減ったということにはなりません。
短期的スパンと長期的スパンの両輪で、将来の様々なパンデミックや災害に備えることが必要でしょう。
コロナ禍の犯罪とデータサイエンス
COVID-19感染症あるいは新型コロナウイルスは、社会に対して様々な影響を及ぼしました。
それは、多くの人の生活様式や行動様式を変え、犯罪の内容や起こり方にも変化をもたらすことになりました。
例えば、コロナ禍における外出抑制策を通じて、多くの人は自宅待機することが多くなりました。
このことは、空き巣被害の発生を抑制する方向に働いたでしょう。
一方で、オンライン上の詐欺であったり、休業中の店舗や学校などの施設を狙った盗難あるいはなどは増加しました。
COVID-19感染症あるいは新型コロナウイルスによって生活や収入に不安を覚えた人が増え、詐欺に遭いやすくなったというのは一見筋が通っていますが、それ以外の要因もあるでしょう。
データサイエンスはどこで活用されるかというと、犯罪の傾向分析や、犯罪の発生予測の部分です。
これらの犯罪の発生状況を可視化し、様々な社会的要因をデータ化することで、「なぜ発生したか」「次は、いつ・どこで発生しそうか」を予測することは社会をよりよくする上で有用です。
犯罪というと別世界のように感じられる方も少なくないと思われますが、生活や社会構造に密接に絡んでいるため、他人事とは思わない方が無難です。
コロナ禍の教育とデータサイエンス
COVID-19感染症あるいは新型コロナウイルスは、教育の場面にも大きな影響を及ぼしました。
テレワークのようにリモートで授業を行うケースも今や珍しくはないでしょう。
リモートになることで便利になることもあれば、当然ながらやや複雑になることもあります。
例えば「出席確認」です。
実際に学校に行って出席するという場合は、その場で点呼を取ればOKですが、リモートの場合は「ログイン」をもって出席とみなしてよいか、悩む場面が生じます。
ログインしていたとしても、実際には本人ではないケースもあり得るためです。
ビデオをつけてもらって確認したり、発言を促すなどの工夫も考えられますが、対面時に比べて悩ましいことには変わりないでしょう。
また、授業を受ける側のモチベーションや、提供者側の技術によって、きめ細かなフォローアップが簡単になることもあれば、難しくなることもあります。
モチベーションの高い学生はリモート下でも(むしろリモート下だからこそ)自己学習をどんどん進める一方で、モチベーションが低い場合はリモート下でサボるという、差の拡大も考えられます。
データサイエンスはどこで活用されるかというと、教育効果の可視化と、成功および失敗の要因分析の部分です。
教育のデジタル化のメリットは非常に大きく、才能とモチベーションを持つ学生のポテンシャルを効率よく引き出す可能性を秘めています。
一方で、ボタンの掛け違いによってその効果が逆の方向に進む危険性もはらむため、利用に当たっては覚悟と技術が必要になるでしょう。
まとめ
「コロナ禍で進化と深化をしたデータサイエンス」というテーマで、COVID-19によってどんな動きや変化が起きているのか、一部をご紹介しました。
これからの世の中がどのような方向に進んでいくのか、期待と不安が入り混じりますが、置き去りにされないようついていきたいものですね。