Meiji.net

2020.09.02

データサイエンティストにとって、データ分析は結論ではない

データサイエンティストにとって、データ分析は結論ではない
  • Share

>>英語版はこちら(English) 近年、データサイエンスが注目されています。様々な分野の問題を解決するために、データを有効に活用することが求められているからです。しかし、データをただ分析するだけでは、期待しているような問題解決は難しいでしょう。では、なにが必要なのでしょうか。

19世紀、コレラの流行を収束させた医師がいた

前野 義晴 2020年3月、WHO(世界保健機関)は、新型コロナウイルスによる感染症(Covid-19)の流行をパンデミックと宣言し、「対策不足を懸念している」と発表しました。大変な事態ですが、人類が未知のウイルスや病原菌に冒されるのは初めてのことではありません。

 1852年には、コレラの世界流行がありました。このとき、流行を収束に向かわせたイギリスの医師の活動は、現代の私たちも学ぶべき点が非常にあります。

 当時、イギリスのロンドンでもコレラが大流行しましたが、まだコレラ菌が知られておらず、医師たちは、激しい下痢をともなうこの病気は空気によって感染すると考え、それに沿った治療が行われていました。

 しかし、1854年、医師ジョン・スノウはその考え方に疑問を抱き、市当局が集計したデータを基に、自ら住民を訪ね、生活の様子や、この病気によって亡くなった人たちの共通点はなにか、違いはなにか、また、死亡者が出ていない家の共通点はなにか、違いはなにか、ということを丹念に調べていったのです。

 その結果、感染経路は空気ではなく水ではないかという思いに至ります。

 彼は、亡くなった人たちの家を地図に落とし込みます。すると、それらの家の近くには共通の井戸があることがわかったのです。

 その後、下水によって汚染された飲み水が病気の原因であることが突き止められ、井戸を閉鎖したことによって、コレラの流行は収束に向かったのです。

 ジョン・スノウは、いまでは疫学の父と呼ばれています。

 データは多くのことを私たちに教えてくれます。しかし、データは、死者をも数値として扱います。すると、そのデータをいくら集計して、なんらかの算出を行っても、それは統計で終わり、リアリティに至らないことがあります。

 ジョン・スノウは、データを基に現場に入り、体感することで、リアリティに至り、そこで水というヒントを得て仮説を立て、データをさらに深く突きつめていったことで、流行を収束させる対策を見つけることができたのです。

 19世紀の人であるジョン・スノウの行動は、今日ではアナログ的と言えます。しかし、問題解決のヒントにたどり着くための思考プロセス、そして、ヒントを基に仮説を立て、さらに深く突きつめて考えていくやり方は、現代のデータサイエンスにとっても同じであると言えるのです。

※記事の内容は、執筆者個人の考え、意見に基づくものであり、明治大学の公式見解を示すものではありません。

  • Share

あわせて読みたい