〈5分でわかる統計学入門〉全員から回答を集めなくても、なぜ信頼できるデータが得られるのか?
標本調査で注意すべき「落とし穴」とは
ただし、注意しなければならないのは、無作為に人を選ぶ場合には、同じような顔ぶれが揃ってしまう可能性も覚悟しなければならないということだ。 陪審員はまったく無作為に選ばれため、「全員男性」「全員女性」「みな同じような年齢」「みな似たような経歴」といった陪審団になる可能性だってある。可能性はきわめて低いが、ありえなくはない。 さらに、陪審員団が被告人といわゆる「同輩」である保証もどこにもない(注:「被告人は被告人と年齢や地位、経歴などが同じ人によって裁かれるべき」だという、陪審についての古くからの考え方を指す)。まったく同じでない可能性だってある。 一方、標本調査で集団同士を比較する場合には、多様性のある標本を用意しなければならない。 たとえば、「ミレニアル世代(1981~1996年生まれ)よりもベビーブーマー世代(1946~1964年生まれ)のほうが、マーマイト好きが多い」というのが本当かどうかを調べるための標本調査を行おうとしたとき、抽出された標本がたまたま全員Z世代(1997~2012年生まれ)だったら、調査を続ける意味がない。 とはいうものの、そうした多様性を実現するには、全人口に関する知識がすでにある程度得られていることが前提となる。 その出発点として有効なのは国勢調査のデータだが、この調査は10年ごとにしか行われないため、そのあいだに直近のデータと現状が年々ずれていく点を考慮しなければならない。 「グッドデータ」(注:統計学的に理想的な良質のデータ)が手に入らない場合には、真実が何であると思われるかについて、なんらかの仮説を立てざるをえない。つまり、人が判断するという人的要素が含まれてしまうことは避けられないのだ。人的エラーが起こる可能性についても同じことがいえる。 写真/shutterstock
---------- ジョージナ・スタージ(じょーじな・すたーじ) 専門は公共政策の計量的分析。英国国家統計局の人口・移民統計に関する専門家諮問グループの一員。国会議員のために調査を行い、統計の利用法や背景情報を解説する上級統計学者。オックスフォード大学移民観測所の顧問も務める。2011年、オックスフォード大学卒業(英文学)。2013年、マーストリヒト大学修士課程修了(公共政策及び人間開発)。 ----------
ジョージナ・スタージ