【リーディングスキルテスト】AIは意味理解できない

f:id:ryosaka:20180412000320j:plain

どうも陵坂です。リーディングスキルテストについて産経新聞が「中高生　読解力ピンチ」というタイトルで取り上げました。

国立情報学研究所の新井紀子教授の研究チームの発表についての記事ですね。2万5000件も調査って、ガチだぜ、ガチ！　

これについては以前、ブログで取り上げました。

www.ryosaka.com

ただ研究の内容を取り上げるよりもツイッターと絡めた記事にしたので少し解説をしていなかった部分があります。そこで今回は補足するような形で書いていきたいと思います。

まず前提
ビッグデータの活用
ディープラーニングという学習
意味や価値は人がつける
元は間違い方の分析のためだった

まず前提

リーディングスキルテストは東ロボくんというAIの東大合格を目指すプロジェクトの中から生まれたテストです。なぜ生まれたか。それは国語の点数がなかなか伸びなかったからです。

「東ロボくん」偏差値横ばい「５７」人工知能、東大合格は断念 - 産経ニュース

この新聞記事にもあるように偏差値は平均して57。

東ロボくんは、センター試験で国語や数学、世界史など５教科８科目を受験。国語は２００点満点中、９６点で偏差値は昨年の４５から５０に上がった。一方、昨年いずれも偏差値６４以上だった数ＩＡと数ＩＩＢは、それぞれ５８、５６と振るわなかった。記述式試験は、理系数学の偏差値が７６、文系数学が６８と好成績を収めた。

センター試験の国語で半分以下の点数って聞いてAIに勝ったぞーー！と叫ぶことのできる高校生も多いのではないでしょうか。じゃあ、AIってどういう仕組みなのさ。

ビッグデータの活用

「ビッグデータ」とは通常では処理できないほどの量のデータのことを言います。このビッグデータをAIによって高速処理します。

文章問題ならその文章内のキーワードを設定してデータベースに検索、検索、検索…として関連するキーワードと最も関連性が高いものを回答とするわけです。

試しに検索サイトで「周辺or地名の美味しいパスタのお店」と検索してください。その時に表示されたリストを覚えておいてください。その後「（同じ場所）の美味しくないパスタのお店」と検索してください。同じリストが表示されちゃます。

AIは「美味しい」と「美味しくない」の意味がわからない。ただ「地名」「パスタ」「お店」で検索してるんですね。

実はAIってこういう仕組みなんですね。私も初めて知った時はビックリしました。

ディープラーニングという学習

AIって学習するじゃん、映画とかで反逆するじゃん。そう思った方もいると思います。ディープラーニングって言葉を聞いたことがある方も多いのではないでしょうか。

ディープラーニングで「猫」をAIに教えるとします。この場合、猫の写真を大量にAIに認識させていくわけです。

ヤマネコ、ペルシャ猫、アメリカンショートヘア、スフィンクスなどなど。あらゆる猫の種類をひたすら認識させ「犬」や他の物体と何が違うのか認識させていくんですね。

これって教育業界だと「内包と外延」って言葉で表現されます。皆さんも小学校で経験されていると思いますよ。

例えば、算数の図形の学習だと教科書に三角形、四角形、平行四辺形、五角形、円がずらっと並んでいて、先生が児童に「じゃあ身の回りにある三角形を探してみよう」みたいな。似たもの探しをして、共通点を見つけて、定義を理解する。

これと同じですよね。

AIとの違いは２点。これをもっともっと大量のデータベースでしていることが１つ。もう一つは自分で意味や価値を設定できないこと。

意味や価値は人がつける

将棋AIがプロ棋士に勝つこともありましたが、じゃあどうやっているか。2012年発刊と少し前の本ですが「人間に勝つコンピュータ将棋の作り方」（技術評論社）がとってもわかりやすかったです。

人間に勝つコンピュータ将棋の作り方

作者: 瀧澤武信,松原仁,古作登,橋本剛,小谷善行,鶴岡慶雅,山下宏,金子知適,保木邦仁,伊藤毅志,竹内章,篠田正人,コンピュータ将棋協会
出版社/メーカー: 技術評論社
発売日: 2012/09/29
メディア: 単行本（ソフトカバー）
購入: 2人クリック: 6回
この商品を含むブログ (25件) を見る

将棋AIっていくつも種類がありますよね。その中で強いAIと弱いAIがあるのってどうしてでしょうか。ビッグデータの処理速度でしょうか。それもあるかもしれません。

でも、この本を読んで思ったのは製作者の棋力（将棋の力量や考え方）も重要だということです。

将棋において「ある一手」を検討する時に何パターンも指し手があり、それを受けた相手の手、その次の自分の手と計算する必要があるわけです。つまり、ある局面で指す手についてプラスとマイナスの評価基準を開発者が設定する必要があるわけです。

この設定の仕方によってAI内部での点数評価が分かれるわけで、指し方がAIによって変わるんですね。だから将棋AI作っている人たちは皆セミプロ以上の棋力を持っているようです。

（書籍の発刊から5年以上の時間が経ちました。2017年では、製作者の棋力も関係なく出来るようになったとコメント欄でご指摘を頂きました。）

元は間違い方の分析のためだった

話は東ロボくんに戻すと東ロボくんは東大受験を断念するわけです。それはこれまで説明したように問題文の意味を理解できないわけで、それでも問題文にあった文字・数字を組み合わせて解答するんだけれど、どうにかならないか。

どういう間違い方が多いのか。人間と間違い方はどう違うのか。そういう課題を元に生まれたのがリーディングスキルテストなわけです。

AIの学習がこの形式をとっているうちは限界があるということですね。

さて、このAI開発の関係で「シンギュラリティ（AIが人間の知能を超すこと）はないのか」という質問が新井紀子教授には多いそうな。新井紀子教授のお答えはシンプル。

resemom.jp

AIにとって「綺麗」「かわいい」とかは人間が教え込めばディープラーニング出来るかもしれないけど、人間のように「ぶちゃかわいい」とか勝手に出てこないわけです、理屈上。

もちろん「ぶちゃかわいい」ものをもう一度ディープラーニングさせれば良いけど、新しい価値観が出てくるたびに繰り返しになるわけだし。これじゃ越えられないよね。

仮にシンギュラリティが起きても人類への反乱は起きないと思うよ。

「攻殻機動隊」という漫画のフチコマ(AI)たちの台詞

「人間同士争わせたら手間いらずで皆殺せるよ」

「でも人間がいなかったらボク達のメンテナンスや新部品開発やオイル交換や全部ボクたちでやらなきゃいけなくなるよ」

「やはり支配すべきか」

「でもそんなことなら支配しなくても今でもやってもらってるじゃない」

（攻殻機動隊p.96）

人間より賢いAIさまがメリットのないことするってイメージしにくいんですよね。こういう想像もたまにしてみると面白いかもしれませんね。

ほな、さいなら。

書評を書きました

www.ryosaka.com

攻殻機動隊は大好きな漫画の一つです。おススメ。

攻殻機動隊（１） (ヤングマガジンコミックス)

作者: 士郎正宗
出版社/メーカー: 講談社
発売日: 2014/06/27
メディア: Kindle版
この商品を含むブログを見る

りょうさかさんと

教育業界にいる陵坂さんが教育・子育て・DWEなどについて書くブログ