学力テストは、教育をゆがめているのか? 教育行政にはびこる「測りすぎ」の問題
■学校も、文科省も、世間も、数値目標がお好き!?
ここ10年くらい特に顕著でしょうか。学校や教育行政は、数値化した目標や、数値データに基づくPDCAが大好きになってきた感があります。
「いや、好きなわけじゃないですよ。やれと言われて仕方なくやっているんです。」という声もたくさん聞こえてきそうですが。
最たる例が、全国学力・学習状況調査(以下、全国学テ)です。
平均得点率やその都道府県別順位に毎年注目が集まります。毎年、テストを受ける児童生徒は異なるわけですから、経年変化を見ても、さして意味があるデータなのかは考えものですし、順位の前後では、統計的に有意な差はないくらいの得点差であることも多いのに、前の年より順位が下がったりすると、首長や議会、教育委員会などは、大騒ぎになります。
教育には数値化されない効果、意義や、数値化がなじみにくい要素も多い。そんなことは、教育関係者なら、みんな知っています。ですが、実際にやっていることは・・・、数値化されたものを追いまくっているわけです。しかも、それが、意味のあることや、コスト・労力に見合うものなら、まだいいのですが。
昨年12月には高知県の土佐町議会が、全国学テを公立校悉皆でやるのではなく、抽出式にするべきだという意見書を採択し、国に提出しました。
■測りすぎ!?
こうした疑問を深めてくれるのが、ジェリー・Z・ミュラー著、松本裕訳(2019)『測りすぎ―なぜパフォーマンス評価は失敗するのか?』という本です。
教育についても触れられていますが、医療やビジネス、行政などでも、定量的な評価(数値目標による管理と評価)、業績評価が組織をダメにしてしまう例をふんだんに紹介してくれています。
わかりやすいのが医療、病院。
ニューヨーク州では、冠状動脈バイパス手術の術後(30日後)死亡率をもとに、心臓外科医の成績表を公表しています。患者目線から見ると、有益な情報のように思いますよね?死亡率の低い医者にかかりたいですし。
ところが、この成績表には副作用がありました。
外科医が症状の深刻な患者の手術をやりたがらなくなったのです。評価、公表されるデータには、手術を受けた患者のみが対象であり、外科医が手術を拒否した患者は含まれていません。
こういう問題を「上澄みすくい」と言います。
また、こういう評価だけでは、難しい(手術の難易度が高い)患者を受け入れざるを得ない病院が損をしやすいですよね。
■問題は警察でも
1994年にニューヨーク市警が開発したのが始まりの「コンプスタット(コンピュータ・スタティックス」。これは、GIS(地理情報システム)を使って犯罪件数を地図上に落とし込んで、犯罪パターンを可視化するもので、犯罪が集中しているホットスポットに人員を適切に配備することなどに活用されています。米国ではいくつもの大都市で導入されています。
役立ちそうですね。しかし、市長が犯罪件数を改善するように警察幹部にプレッシャーをかけ、そのプレッシャーが転じて各管轄の署長に与えられ、署長たちが自分の昇進は犯罪の着実な減少にかかっていると信じるようになると、事態はおかしな方向に動いていきます。
現場の警察官のなかには、犯罪件数削減のプレッシャーを感じるあまり、あるいは、そうしないと自分の評価は下がるのではないかと感じるため、数字いじりを始める人が出てきました。意図的に、報告しない、分類を軽い犯罪として記録するようになるなどです。
加えて、短期志向になることも報告されています。何年もかかる捜査の末に麻薬王を逮捕するよりも、街角でドラッグを売っているティーンエイジャーを1日5人逮捕するほうが、統計的にいい結果を出すことができるというわけです。
■教育でも起きている「上澄みすくい」
問題は、学校教育でも起きています。この本では、米国の学校が落ちこぼれ防止法のもとで、テスト偏重になっていった様子を報告しています。
「学校の幅広い目標を犠牲にしてテストそのものに注力しようとするなど、ねじれたインセンティブを生むようになってしまう」と述べています。この一文は、あとでも解説しますが、とても大事なので、ちょっと気にとめておいてくださいね。
警察等で見られた「上澄みすくい」は学校でも起きています。テキサスとフロリダで学校を調査した結果、学力の低い生徒を「障害者」として再分類し、評価対象から除外して成績の平均を引き上げていることがわかりました。
あるいは、教師が生徒の解答に手を加えたり、点数が低そうな生徒の答案用紙を捨ててしまったりしていることも判明しました。
なんともひどい話ですよね。ここで「米国のような不正がないことを祈っていますが。」とわたしは一度書いたのですが、少し調べてみると、なんと、日本でも米国と似たことが起きているのです!
こうした学校が多いのかどうかはわかりませんし、一部の事例を安易に一般化して多くの学校であるとは言えません。ただし、不正なのですから、オモテにはなかなか出てこないことでもあります。
多いかどうかはわかりませんが、教育現場で、おかしなことが起きているところもある、そして、もちろん、こんな不正をするようでは、教育機関として失格だろうということは、共有しておきたいと思います。
■「測りすぎ」は、本来の重要な目的、目標から人々を遠ざける
前掲書では、病院、警察、学校、大学、軍など、さまざまな組織における評価の罠、「測りすぎ」の問題点を炙り出してくれているわけですが、教訓として、次の点などが指摘されています。
●測定されるものに労力を割くことで、目標がずれる弊害
●短期主義の促進
●リスクを取る勇気の阻害、イノベーションの阻害
(失敗等を重ねながら長期的に取り組むことが評価されにくくなるため、リスクを取ろうとしなくなる。また、評価はまだ誰も試みなかったことへの挑戦や実験を妨げる。)
●協力と共通の目標の阻害
(個人に対して報酬を与えると、共通の目標への意識や協力が減退する)
●時間コストがかかること
●規則の滝
(数字の改ざんや不正などを止めようとして、組織はたくさんの規則をつくって従わせようとする)
学校や教育委員会にお勤めの方は、おそらく実感されているでしょう。日本の学校でも、まさに上記のような問題があちこちで起きていると。
■学力テストは、子どもたちの学びをゆがめている可能性が高い
なかでも、わたしが最も心配するのは、目標がずれる弊害と短期主義(短期志向の強まり)です。
全国学テが一番わかりやすい実例でしょう。首長は教育長に学テの順位を上げろとプレッシャーをかけます。教育長は(首長にさからうとクビになりかねませんし)、教育委員会のスタッフに号令をかけます。それが校長へ行き、校長から現場の教員へと伝達されていきます。さきほどの米国の警察の話とソックリですよね。
また、全国でも上位のある県では、全国学テの学校別の順位が教員には共有され、かつ教員別ランキング的なものも出るそうです。もちろん、点数が低かった教員には、教育委員会の指導主事等から厳しい「ご指導」が入ります。詳細は取材していないので、確定的なことは申し上げられませんが、たとえば、学習に困難な子がたまたまそのクラスに多かった、といった事情は考慮されず、冷徹な担任別順位が独り歩きしかねません。
わたしは、学力をあげようとすること、とりわけ、低学力層をなんとかしようと頑張ることなどは、たいへん価値があることだと思います。そのために、ときには、テストをして進ちょくを確かめたり、独りよがりの政策や指導になっていないか振り返ることは必要です。
ですが、全国学テの関連で起きていることは、あまりにもテストの結果追求、テスト対策偏重に現場を振り回しているという弊害です。
これだと、いくら学習指導要領で、「学びに向かう力(好奇心、リーダーシップ、学び続ける力など)も大事だ」などと文科省等が言っても、「きれいごとだよね」と学校現場は冷めた目で見つめます。そもそも、そんな中長期なことは、追いまくられる日常のなかに埋もれてしまい、いつの間にか忘れ去られてしまうケースもあります。
問題は、子どもたちにも、大きく影響しています。
かなりの地域では、全国学テ対策として、都道府県独自のテストと市のテストなどがあります。先ほどの土佐町の意見書によると約70%の都道府県、85%の政令市で独自テストを実施。小学生にもです。
また、地域によっては、過去問を何度も解かせている例もあります。過去問には良問も多いでしょうから、それ自体は悪いことばかりと言い切れませんが、子どもたちを「過去問漬け」にしている学校もあるのは、どうかと思います。
内田良先生の記事によると、ある小学校では、4月の2週間、約半数の授業コマが学テ対策に費やされていました。
※内田良「全国学力テスト 直前に過去問くり返し 子ども・教員に負担 継続か、廃止か、抽出式か」
子どもたちの好奇心を刺激する、わくわくする授業をするなんてことは、二の次どころか、三の次よりあとになってはいないでしょうか?
これでは、子どもたちに誤ったメッセージを与えてしまいます。「とにかくテストでいい成績を取れ」と。(「隠れたカリキュラム」の呼ばれることのひとつ)。また、テストは基本個人勝負ですから、協働的な学びの時間にもなりません。
いつから、学校は塾や予備校になってしまったのでしょうか?(塾や予備校のほうがおもしろい授業をしているところもありますので、不正確な指摘かもしれませんが。)好奇心を高める、楽しい授業や、協働的な学びのジャマをしているとしたら、なんのための学力向上施策なのか、わかりません!
しかも、たちの悪いことに、全国学テは毎年4月にやります。4月は、新しい学年と学級になり、学級運営上、もっとも大事にしたい数週間です。これがテスト対策で費やされてしまう学校もあるとなると、子どもたちの人間関係の形成でもマイナス影響が心配です。
文科省は、まったくのんきなもので、新指導要領が小学校で4月から始まる(=教科書も変わる)というのに、相変わらず、全国学テは4月からやる予定のようです。
昨日も国の審議会(中教審)で文科省の幹部は、こう話したそうです。「全国学力学習状況調査は早期のCBT化を測る」(教育新聞2020年1月24日)。CBTとはComputer Based Testingで、パソコン上で回答する方式のことです。OECDのPISAで、日本の子どもたちはCBTに不慣れなことが影響しているのでは、という推測があっての発言だと思いますが、全国学テの問題と必要な政策は、「そこじゃない!」
エビデンスベースの政策が重要、とよく言われるようになりました。学力テストも、授業改善などを評価するエビデンスのひとつというわけです。ならば、学力テストの功罪についてのエビデンス、いや、もっと手前のことですが、ファクト、事実をしっかり見ていくことのほうが、もっと必要だと思います。
もう一度引用しておきます。「学校の幅広い目標を犠牲にしてテストそのものに注力しようとするなど、ねじれたインセンティブを生むようになってしまう」。この心配が杞憂であればいいのですが。