思考力や創造性の評価で最も役立つのは小論文だと思います。
しかし、小論文は採点に手間がかかることと、客観性が必ずしも保証されないことから、本格的に利用しているところはありません。
小論文の本格的な利用とは、複数のテーマで1200字以上の小論文を何本か書くような形の利用です。
字数が短い小論文であったり、1つのテーマで1本だけ書くような形では、誤差の方が大きくなります。特に、傾向が予測されるような小論文の場合は、準備の有無がその小論文の出来を左右するので、小論文試験と言っても本当の実力がどれぐらい正しく評価されるかは疑問です。
この小論文試験の評価に活用できるのが、深層学習です。
まず、同じテーマで複数の人が小論文を書いた場合、そのテーマに関連性の深い文章というものが評価されます。
つまり、みんなが同じような形で論じている傾向に近いものほど、テーマに深く関連していると考えられるのです。
しかし、みんなと同じ傾向だということは、それだけ平凡だということです。最も平凡で最もありきたりのものが高い評価を受けることになってしまいます。
そこでもう一つの評価は、みんなと異なっている度合いを評価するということです。
大きな論旨は、みんなが論じているものと同じだが、その中身がユニークで幅が広いという小論文が、論理性と創造性を兼ね備えた文章だと考えられるからです。
これは、人間が文章を読むときの感覚と似ています。
上手な文章というものは、書き出しと結びは一つの輪のように収斂していて、テーマと結びついていますが、その途中の展開がユニークで幅広く独創的なのです。
ただし、以上のような評価を、自然に書かれた文章だけで評価するのは、深層学習には若干荷が重いと思います。
そこで、小論文試験の場合は、書く文章にある方向性を持たせるようにするのです。
こうすれば、人間が評価するのとかなり近い評価を機械採点でできるようになると思います。
ここでよく誤解されるのは、機械が価値を評価しているのではないということです。
価値を評価できるのは人間だけです。それは、生きた人間は、希望や願望や欲望といった未来に目指すものを持っているからです。
機械がそのような価値観を持つようになるかもしれないという人がいますが、それは単に言葉の遊びです。生きているものは希望を持ち、生きていないものは希望というものがそもそもないから生きていないのです。
機械による評価が容易にできるようになれば、学校教育の中で文章を書く機会をもっと増えます。
知識を詰め込む勉強だけでなく、その知識を生かす勉強をすれば、勉強はもっと楽しくなってくると思います。
参考までに、森リンという自動採点ソフトが評価した森リン大賞のリストです。(この森リンは、まだ深層学習を使っていません)
https://www.mori7.net/oka/moririn_seisyo.php