試験雑感

試験雑感

執筆:教授 川本清

 近頃試験が話題である。
 試験にも様々ある。学生の気になる試験は定期試験かもしれない。就職やスキル上達に関連する資格試験に取り組んでいる人もいるだろう。大学に在籍しているからにはなんらかの入学試験をパスしているはずだ。人が受ける試験ではなく,材料や物品を選別したり格付けしたりするための試験もある。他にもあるかもしれないが,それらの試験はいったいどのように評価されているのだろうか。ここでは人に関わる試験について,試験する立場から考えてみよう。
定期考査や資格試験は被験者が一定の水準を満たしているかを判別できれば良い。一方で入学試験など定員を選抜する試験では順位づけが必要だ。何かを評価するかによって試験は内容も方法も変化する。
 科学的計測に掛かる試験なら,試験結果を具体的な計量データ,もしくは計数データとして捉えることができるだろう。ベンチプレスで何kg挙げることができるか,縄跳びを何回まで飛び続けることができるか等の結果は,光電子増倍管による光子検出などと同様に物理的なデータである。もちろん,体調による変動はあるかもしれないが,体力やスキルの一面を具体的に評価できるだろう。
知識やその応用展開力を測る試験の場合はどうだろうか。
 ペーパー試験は採点され点数化される。この点数の基になる出題内容や配点の重みづけにはある種の任意性が入り込む余地があり,必ずしも一律にスケールされたものとはみなせない。このような点数は評点データといい,計数データとは区別される。試験にはボーダーラインが設定されていることが多いが,評点データは試験者側に由来するある種のゆらぎが含まれているため,相対的にボーダーもゆらぐことになる。
 レポート試験などでは,事前に設定したチェック項目をリスト化したルーブリックを用いて評価することがある。リストされた重点項目の充足度を評価することになるが,本質的には優劣の一対比較を繰り返す順位データや,良否を二分法的に判定する分類データとしての性格を強く含むものと考えるのが妥当だろう。このようなチェック結果を何らかの換算式にあてはめて評点データ化することもあるが,当然その評価結果にはゆらぎが避けうべくもなく含まれる。
 試験の多くには試験をする側の人に依存する部分が存在し,官能検査的な側面があることは避けられない。合否のある試験で「1点に泣く」状況に不合理を感じるとすれば,このような含意が無意識のうちにも理解されているからであろう。人に依存する部分の影響を小さく抑えるための方法の一つは作題や採点に関わる人の専門性を高めることである。専門家の数も限られるため,自ずと試験の規模も制限されることになる。良質で理想的な「AI」で採点すれば規模の問題は解決するかもしれないが,それでも出題にゆらぎが含まれることは変わらない。将来には,作題も含めてゆらぎのない試験を設計することができるようになるのかもしれないが,それは現在の我々が思いつくような試験とはまったく異なったものになっているだろう。
 人に対するものではなく,材料や物品に対する試験・実験の場合も,対象に対する理解・専門性は深いに越したことはない。新しいことに取り組んでいるときは,知見が十分でないこともありうる。有意に思える結果こそ慎重に取り扱わねば思わぬ陥穽に陥ることにもなりかねない。

図1 光電子増倍管は光電陰極に光子が入射する事象を検出(フォトンカウンティング)するもので,いわば計数検出器である。ニュートリノ検出用に開発された浜松ホトニクス製の20インチ光電子増倍管は,2014年,電気・電子分野の歴史的に優れた技術成果を顕彰するIEEEマイルストーンに認定された。写真は東京大学理学部1号館サイエンスギャラリーに展示されているもの。