データサイエンティストにとって、データ分析は結論ではない vol.2
データサイエンティストにとって、データ分析は結論ではない vol.2 前野 義晴(明治大学 総合数理学部 特任教授) 近年、データサイエンスが注目されています。様々な分野の問題を解決するために、データを有効に活用することが求められているからです。しかし、データをただ分析するだけでは、期待しているような問題解決は難しいでしょう。では、なにが必要なのでしょうか。 ◇データを分析しただけでは得られない結果がある この10年、ICTの発展が、巨大な高精度データと高速の計算アルゴリズムをもたらしました。これらは、ビジネスのあらゆる場面でデータサイエンスが興隆する原動力となっています。 例えば、ネット通販の商品推薦やコンビニの売り上げ予測などは、データとアルゴリズムが支えています。 しかし、社会経済の問題を解くことは、これらのビジネス応用とは少し異なります。必ずしも、問題を類型化して上手く解けるとは限らないのです。 個別性の高い、新しい問題では、これまでのデータから学習した共通の構造にアルゴリズムを当てはめても解けません。 では、どうすれば良いのか。データとアルゴリズムを駆使する機能はもちろん、現実のリアリティを深く鋭く読み解くデータサイエンスが必要なのです。 ジョン・スノウが、市内の死者数のデータから、今後、さらに死者は増えるだろうとか、当時信じられていたように、病気とは空気感染するのだから、住民の外出を規制しよう、という分析だけで終わっていたら、いま、目の前で起きているまったく新しい病気の感染の要因が、井戸の水であることにはたどり着けなかったでしょう。 当然、感染対策、つまり、問題の解決にも至らなかったと思います。 なぜ、彼にはそれができたのか。医師であった彼には医学の知識や、患者を診察する多くの経験とそこから得られる知見があり、リアリティに迫る行動力がありました。 つまり、それらは、現代のデータサイエンティストにも求められるスキルセットであると思います。 すなわち、データを1回分析しただけで結果が得られたと思うのではなく、なぜそうなるのか、なぜこうなるのか、と考えを繰り返し、突きつめ、そこから仮説が見えてくれば、今度は、それが成り立つのかを調べるためのデータ分析を行ったり、新たなデータを集めたり、といった活動です。 こうした活動によって、はじめて新たな問題解決に近づけると思います。つまり、重要なのは、データ分析後の「なぜ」であり、そこからどのような仮説を立てられるのか、というサイエンスとは矛盾するような、アイデアや構想力なのです。 ※取材日:2020年6月 次回:データ分析からアイデアを生むために必要なもの(12月23日12時公開予定)
前野 義晴(明治大学 総合数理学部 特任教授)