東大生が解説!実はトレンド把握に使える「微分」の本質を簡単に理解するコツ
しかし、それでは実は問題が起こってしまうのです。例えば、1日に世界中で投稿されたポストが合計で10億個存在したとします。その中で、ポストの中に多く含まれていたワードを順番にトレンドにした場合、どのようになるでしょうか。 おそらく、「今日」「天気」「楽しい」「面白い」「グルメ」「ランチ」というような、日常生活に即したワードばかりがトレンドに並ぶことになってしまいます。多くの人がつぶやいている言葉を把握することはできますが、これでは「流行りをキャッチする」とは言えません。
■大事になるのは「変化量」 トレンドを考えるうえで大事になるのは「変化量」です。先ほど例に挙げたポストの中に含まれるワードについて、「前日からの変化量」で考えてみましょう。 例えば、2024年5月21日の総ポスト数と、5月22日の総ポスト数が10億で、「天気」「グルメ」「野球」のワードが含まれていたポスト数が、以下のとおりだったとします。 ●2024年5月21日 天気:100万、グルメ:50万、野球:10万
●2024年5月22日 天気:98万、グルメ:52万、野球:20万 この場合、ポストされた数だけで考えれば、トレンドの一番上に入るのは「天気」です。しかし、前日からの変化量で考えれば、天気は「2%減」、グルメは「4%増」なのに対し、野球は「100%増」、つまり2倍になっています。このように考えると、明らかに5月22日に流行しているポストは「野球」に関連するものであることがわかるでしょう。 この「変化量」を、さらに細かく分解して考えると、より「今」の流行を敏感に捉えることができるようになります。
先ほどの例では「前日比」で考えましたが、「前の1時間との比較」「前の10分との比較」というふうにより時間間隔を短くしていくのです。1日(24時間)で10万のポスト数、という数値は同じだったとしても、分解してみるとまったく違う分布をしている場合もあります。18~20時の2時間で9万5000ポストを占めていた、なんてこともありうるわけです。 このように考えると、時間を細かくすればするほど、「流行」の正確性は高まる、ということがわかります。この「分解」の営みは、まさに高校数学で習う「微分」の考え方なのです。