その数字を信じてはいけません!【ウソをつく方法】
「数字はウソをつかない!」とよく言われます。確かに、数字はウソをつきません。しかし、数字を使う人はウソをつく事が有ります。少し前ですが、以下のように記事が掲載されました。
数字は正しいのですが、それを扱う人間によって大きく印象操作されてしまうのです。
それでも数字はウソをつくか?
数字を上げられると妙に納得する傾向があります。しかし数字ほどウソ、極端には詐欺に使われるものはありません。正確に言えば、数字は正しくとも、その数字の意味が十分説明されず、結果としてウソや詐欺に使われてしまうのです。ある調査でSE(システムエンジニア)の平均年収が590万円と出ています。この平均という言葉が曲者なのです。一般的には平均590万円と言えば、ほとんどの人が590万円前後の給与であるとイメージしてしまいます。しかし、ほとんどの人が200万円前後で、一部の人が2000万円以上ならば、平均をとれば、590万円になることだってあり得るのです。平均がすべての特徴を表しているわけではないのです。この「平均神話」が幅を聞かせている一つの理由が、「ほとんど同じ」という発想です。年収に関しても、格差がなくほとんど同じという仮定の上で、平均というイメージがあるのです。平均だけでは何もわからず、逆に平均によって間違った理解をすることがあるのです。
また、平均という言葉にも裏があります。通常は相加平均を単に平均と呼んでいるのですが、計算式が異なる相乗平均や調和平均もあり、一般化平均や加重平均もあります。いろいろな平均を求める方法があり、場合によっては平均という言葉だけで、都合のよい値を選んで公表することもできるのです。
また、「SEの平均年収は590万円」とだけ書けば「すべてのSEの平均年収」と錯覚してしまいます。統計学的に言えば、この平均値は母集団の値か、あるいは標本に対する値かということです。一般には標本に対する平均値となります。つまり、世の中のすべてのSEの平均年収ではなく、一部のSE(サンプル、標本)を選んで、その平均値なのです。その選び方、数も大きく影響するのです。数字や統計は往々にしてウソをつくことがあるのです。
早起きは三文の得
以前、「朝、味噌汁を飲む人は健康というデータが示された」というニュースが流されました。この手のニュースは時折、最近のクイズ形式のバラエティ番組でよく紹介されます。では、味噌汁は健康に良いのでしょうか。たとえ、数十万人という十分なサンプル数で、かつ、何十年にわたる長期間の調査であったとして味噌汁が健康に良いのか否かということはわからないのです。数字というデータだけが独り歩きをし、騙されてしまうことが多いのです。
朝に味噌汁を飲み人と味噌汁を飲まない人に分けて、数十年のわたり健康調査を行い、味噌汁を飲む人で健康な人の割合が、飲まない人で健康な人の割合に比較して、圧倒的に、たとえば何倍も多いとしても味噌汁の効用については何とも言えないのです。たとえば、味噌汁を飲むことが健康に寄与するのではなく、朝、味噌汁を飲むためには早起きしなければなりません。一般的に早起きするためには規則正しい生活をする必要があり、それが健康に寄与しているかもしれないのです。このデータを信じるためには少なくとも味噌汁以外を同じ状況にするとともに、味噌汁以外のものを飲む必要があります。一般に原因と結果の関係を明白にすることは非常に難しいのです。複雑怪奇な統計分析手法は多々あり、医学や工学等の理系の分野だけでなく、経済学や心理学の文系の分野で用いられています。後者の方がその利用については進んでいますが、この結果と原因の関係を明確に導出する統計分析手法は存在しません。原因や結果の候補は導出できる場合もあるのですが、最終的な意味付けは、人の経験による主観で行います。何のデータなのかということは疑ってみる必要があるのです。
「コーラの過剰摂取は低カリウム血症を引き起こす」とのニュースもありました。ソフトドリンクの過剰摂取と健康上の問題はよく取り上げられ、飲み過ぎは健康に悪いことぐらい、実験をしなくても理解できそうです。では、コーラが低カリウム血症だけでなく、体に悪いのかというと疑問が残ります。過剰摂取と言っても、どれぐらい飲めば過剰摂取か人によって基準が異なるからです。私の個人的な基準では、一日1リットル飲めば十分過剰摂取のような気がするのですが、ニュースでは一日2リットルから9リットルと書いています。9リットルも飲む人が多いとは思えないのですが。