【気象の統計学】台風は火曜日が好き?
今シーズンは、台風17号が鹿児島県指宿市(9月4日)に、台風18号が愛知県豊橋市(9月16日)に上陸しました。鹿児島県は全国で最も上陸数が多い県ですが、最近は2007年の台風4号以来、上陸が途絶えていました。一方、愛知県豊橋市は2年連続で台風が上陸しました。
気象の統計学
今日は気象データを使った簡単な統計学をご紹介しましょう。
台風は平均すると一年間に2~3個上陸します。1980年~2011年までに上陸した86個の台風を曜日別に分けてみると、次のようなグラフになりました。
結果をみると、上陸した台風が最も多いのは「火曜日」、逆に最も少ないのは「日曜日」となり、その差は2倍以上です。グラフをそのまま読むと、「台風の上陸は曜日に関係ある」と結論づけてしまいそうですが、はたして正しいのでしょうか?
以下は少し専門的になりますので、難しいと思われた方は最後のまとめにどうぞ。
ピアソンのχ2(カイ二乗)検定の「適合度の検定」
曜日によって変化すると考える台風の上陸日の分布(観測度数の分布)と、曜日には関係ないと考える台風の上陸日の分布(期待度数の分布)のギャップを表すのがピアソンのχ2(カイ二乗)検定の「適合度の検定」です。
まず、「台風の上陸は曜日に関係ない」という帰無仮説を立てます。続いて、これらの曜日別度数差から計算された統計量(近似のχ2乗値)を求めて、限界値(χ2乗分布から読み取る)と比べます。
この場合のχ2乗値(適合度の検定)は、6.45772となりました。自由度は6(7-1)、有意水準5%の限界値(信頼度95%)は12.5916です。
χ2乗値は有意水準5%の限界値よりも小さいので、「台風の上陸は曜日に関係ない」という仮説は否定(棄却)されません。
まとめ(結論)
統計的には「台風の上陸は曜日に関係がない」ことになります。つまり、台風が上陸する曜日に偏りがあるように見えても、実は偶然なのです。でも、偶然であることが分かって、どんな意味があるのだろう?と思った方が多いでしょう。身の回りの、ありとあらゆるシーンに数字が使われていて、知らず知らずのうちに、数字やグラフから受けるイメージで判断してしまいます。数字を誇張したり、偶然でないように見せかけている場合もあるでしょう。統計学はビジネスだけでなく、数字のマジックにだまされないことにもつながります。ぜひ、おためしあれ。
【参考文献】
統計学の入門書としておすすめする本
入門統計学 検定から多変量解析、実験計画法まで:栗原伸一,オーム社,2011
まずはこの一冊から 意味がわかる統計学:石井俊全,ベレ出版,2012