4.評価の「妥当性」と「信頼性」

ある数学のテストをしたと考えてみましょう。
たとえば、「台形の面積がなぜ(上底+下底)×高さ÷2で求まるのかを説明しなさい。」という問題です。
一般に、テストや課題を用いた評価を考えるとき、「妥当性」と「信頼性」という2つの視点があります。
「妥当性」とは「知りたい子どもの学力や学習状況を、その方法で本当に捉えることができているか」という視点です。
たとえば、「台形の公式を証明せよ」という問題で、「台形の面積の性質」や「面積を結合・分割する考え方」の理解を見たいのであれば、この問題は比較的妥当だと言えそうです。
一方で、「公式を使った計算方法」だけを見るのであれば、この問題はあまり妥当ではないかもしれません。また、「生活場面で面積を用いて思考する力」を見る目的であれば、妥当とは言えないでしょう。
ある結果から知りたいことが分からなければ、その後の反省や、指導と学習を改善していく方向も的外れになってしまいます。そのため、「評価」においては、まずこの妥当性が大切になります。
一方、「信頼性」とは、「いつ、誰が評価しても同じ結果になるか」という視点です。
評価論では、「いつ誰が評価しても同じ結果になるか」を考える際に、「客観性」ではなく「信頼性」という言葉を使います。
たとえば、「台形の公式を証明せよ」という問題について、ある子どもの答案を複数の教師が15点満点で採点したとします。
その結果、同じ答案であるにもかかわらず、4点から11点まで大きく点数が分かれたり、教師ごとに重視する観点が異なっていたりするようであれば、その評価は信頼性が高いとは言えません。
採点した人によって結果が大きく異なってしまうと、その評価結果が何を意味しているのか分からなくなり、指導の改善にも、成績づけにも使いにくくなってしまいます。
そのため、妥当性と同じように、信頼性も大切になります。
なお、信頼性を高める工夫は、単に〇✕がはっきりするテストを使うことだけではありません。複雑な課題でも、評価をする人たちの間で基準をきちんと作成・共有するなど、いろいろな工夫が考えられます。
このように、妥当性と信頼性は評価において重要な2つの視点です。
【文献】
西岡加名恵・石井英真・田中耕治編(2022)『新しい教育評価入門:人を育てる評価のために(増補版)』有斐閣
