Yahoo!ニュース

新型コロナ感染症と「タバコ」:ヤフーの「ビッグデータ」は何を示したか

石田雅彦科学ジャーナリスト
(写真:アフロ)

 新型コロナ感染症の感染拡大防止については、医療・疫学的なデータと同時に人流データなどのビッグデータを利用した解析も行われてきた。そうしたビッグデータ解析の一種に検索キーワードを使ったものがあるが、新型コロナ感染症とタバコ関係のキーワードはどのような関係になっていたのだろうか。

パンデミックの影響はどうか

 筆者は、Yahoo! JAPANの「ヤフー・データソリューション」からYahoo!ニュース個人オーサー向けの統計データ提供を受け、4月と5月にわたっていくつかの検索キーワードについて調べてもらった。この企画は、新型コロナ感染症が大きな社会問題になっている状況下で、それぞれのオーサーがこのパンデミックに関する記事を書く際、ビッグデータをどう活用できるのかというテストケースだったと思う。

 この企画でいただけるデータは、例えば一定期間にどんなキーワードが検索され、検索データの属性(年代、性別)はどうかや一緒に検索されるキーワードにはどんなものがあり、それらはどのような関係になっているか、あるいは都道府県や行政区ごとの来訪者数などだ。もちろん、データは個人が特定できないよう統計化されている。

 筆者の興味は、新型コロナ感染症のパンデミックの期間中に改正健康増進法が全面施行され、タバコや受動喫煙の問題に関し、社会的に重複する影響が現れていたのではないかというものだった。そのため、Yahoo! JAPANからは「コロナ」と「タバコ」「受動喫煙」「禁煙」というキーワードでデータを提供していただいた。

 まず「コロナ」という検索キーワードについてだ。「コロナ」はあまりにも多種多様なキーワードと同時に検索され、それが複雑に関係していた。個々のキーワードについて分析すると紙面が足りないので、筆者が気がついた点を述べたい。

 データの見方だが、大小の円があり、それぞれが単独、あるいは線で結ばれている。青と赤は性比であり、青い円は男性が多く、色が薄くなるにつれて男女比が等しくなり、女性が多くなると赤くなっていく。円の大きさは検索の合算ボリューム(検索量)、結んでいる線は同時検索されたボリュームを表す。

 下の4月7日の図は小さくてわからないと思うが、例えば男性で「感染者数」「パチンコ」「助成金」というキーワードが目立って大きく、女性では「初期症状」「大阪」「給付金」という円が大きい。日付ごとに縮尺的に円や線の大きさ太さが決まっているわけではなく、あくまで相対的な量を表している。

 この「コロナ」という検索ワードと同時に検索されたキーワードを、4月7日からほぼ一週間ごとに追いかけていくと興味深いことがわかる。5月に入ってから、青い円が少なくなり赤い円が目立つようになったのだ。つまり「コロナ」という検索キーワードで他のキーワードを同時に検索する場合、男性は徐々に少なくなっていったということがうかがわれる。

画像

時系列的に見ていくと4月にほぼ男女半々だった円の数や大きさが、徐々に赤が優勢になっていき、5月31日にはほぼ赤で占められていく。男性のキーワードは散発的で、心細いほど量が少なく同時検索されたキーワードとの関係も弱くなっていく。一方、5月31日に女性は「感染者数」「大阪」「北九州」「給付金」「初期症状」を積極的に検索していたことがわかる。データ提供:ヤフー・データソリューション

 これはいったい何を意味するのだろうか。男性は「コロナ」という検索キーワードで同時に他の言葉を調べなくなったのだろうか。だとすれば、それはなぜなのだろうか。

 おそらく男性の場合、5月中旬以降、新型コロナ感染症について一通りの知識を得ており、改めてネットで検索しなくなっていったのではないだろうか。また、男性にはいわゆる「自粛疲れ」のようなものが、女性より強く出ていたことが影響しているのかもしれない。

受動喫煙の検索は限定的か

 次に「タバコ」というキーワードをみてみよう。このキーワードで特徴的なのは、4月中にはなかった同時検索キーワードが、5月に入ってから出現したことだ。それが「苦情」「ベランダ」「マンション」で女性の割合が多い。

 これは、おそらく外出自粛やテレワークが続き、喫煙者が集合住宅でタバコを吸ったことで何かイベントが起きたのだろう。そのため、「タバコ」と一緒にこうしたキーワードが検索されたと考えられる。その他のキーワードは、個々バラバラで「タバコ」と単独でキーワードが一つずつ検索されていることがわかる。

画像

5月に入ってから集合住宅での受動喫煙問題がクローズアップされたことがうかがえる。このキーワードや同時検索は4月には現れていない。データ提供:ヤフー・データソリューション

 4月1日から改正健康増進法が全面施行された。公共施設の屋内と多くの飲食店は原則禁煙となり、新型コロナ感染症のパンデミック下で喫煙者がとった行動が興味深いが、それは検索キーワードに現れているのだろうか。「受動喫煙」というキーワードと同時に検索されたのはどんな言葉だったのだろう。

 当然だが、4月1日をまたぐ期間に「受動喫煙」と一緒に「健康増進法」「4月1日」「タバコ」「対策」「罰則」「コロナ」といった言葉が検索されていたが、男性で「死者数」や「パチンコ」、女性で「アイコス」や「影響」といったキーワードのボリュームが強いことがわかる。

 しかし、こうした検索の動きは4月に入ると急速に失われ、「受動喫煙」というキーワードと関連する言葉は数個に絞られていく。それは男性で「健康増進法」と「死者数」、女性で「コロナ」「影響」「アイコス」「電子タバコ」だ。この傾向は男女ではっきり分かれていたが、女性がアイコスなどの新型タバコによる受動喫煙を意識し始めたことを意味するのかもしれない。

画像

4月1日前後の検索キーワードは多種多様な言葉が点在する。これが次第に絞られ、男女ではっきりと分かれていった。データ提供:ヤフー・データソリューション

 簡単だが、今回のテストケースから見えてきたことを紹介した。筆者の目的である新型コロナ感染症と改正健康増進法の関係を知ることはできなかった。最後の「受動喫煙」というキーワードは、改正健康増進法の影響を調べるには、もっと別の言葉にしたほうが、いろいろなことがわかったかもしれない。

 最後になるが、貴重なデータを提供していただいたYahoo! JAPAN「DATA SOLUTION」に感謝する。また、今回の記事では来訪者や住人のデータが使えなかったことが悔やまれる。

 余談ながら筆者は、株式会社Agoop(ソフトバンクグループ)代表の柴山和久氏の書籍『AIの未来をつくるビヨンド・ビッグデータ』(日経BP)で企画編集の仕事をしたことがあり、その際、ビッグデータが持つポテンシャルについて同氏よりいろいろと教えを受けた。その経験が今回の記事に少しでも活かせていたとしたら幸甚である。

科学ジャーナリスト

いしだまさひこ:北海道出身。法政大学経済学部卒業、横浜市立大学大学院医学研究科修士課程修了、医科学修士。近代映画社から独立後、醍醐味エンタープライズ(出版企画制作)設立。紙媒体の商業誌編集長などを経験。日本医学ジャーナリスト協会会員。水中遺物探索学会主宰。サイエンス系の単著に『恐竜大接近』(監修:小畠郁生)『遺伝子・ゲノム最前線』(監修:和田昭允)『ロボット・テクノロジーよ、日本を救え』など、人文系単著に『季節の実用語』『沈船「お宝」伝説』『おんな城主 井伊直虎』など、出版プロデュースに『料理の鉄人』『お化け屋敷で科学する!』『新型タバコの本当のリスク』(著者:田淵貴大)などがある。

石田雅彦の最近の記事