近年の人工知能の発展はめざましく、桁数の多い四則演算はもちろんのこと、将棋ではプロ棋士と大差ない勝負を繰り広げ(先日このコンピュータ将棋プロジェクトは終了宣言が出されましたが)チェスでは既に世界チャンピオンを下しており、特定の分野においては人間の知能を既に超えた力を持っていると言えます。

しかし、あくまで特定の分野での話です。

人類はコンピュータのように素早い計算をすることはできませんが汎用性の高い一般的(やや不適切な表現ではありますが)な知能を持っています。かつてはコンピュータにそのような知能を持たせることは不可能だと考えられていましたが、今やチューリングテストを通過したコンピュータがいる時代です。そのような一般的な知能をコンピュータが持っていても不思議はないでしょう。さて、では現代の科学の粋を集めた人工知能が持っている一般的知能はどの程度のものなのでしょう。機械の一般的知能は人間に遥かに及ばないものなのか、匹敵するものなのか、それとも遥かに凌駕するものなのか。

マサチューセッツ工科大学が自校の人工知能『ConceptNet4』に一般的な知能を計るテストをおこなわせました。

Today, we get answer of sorts thanks to the work of Stellan Ohlsson at the University of Illinois and a few pals who have put one of the world’s most powerful artificial intelligence machines through its paces using a standard IQ test given to humans.

『一般的な知能』と言われてもピンとこないと思われます。それもそのはず、一般的な知能という言葉が明確かつ的確に言語で表現できるのならば恐らくとっくの昔に機械は一般的な知能を取得しているはずだからです。ですので、研究者は一般的に『一般的な知能』を計るとされているIQテストをコンピュータにおこなわせることにしました。

さて、そんなMITの粋を集めた人工知能に出題されるテストの内容はどのようなものなのでしょう。例題とともに見ていきましょう。

第1題:情報問題

この問題は問題文に示された特定の対象を画像の中から発見し選択する問題です。

では問題です。

鹿はどれでしょう。
deer

鹿はどれでしょう

一体どれが鹿なんだ……。

image by

Getty Images

正解は下段中央の細長く茶色い物体です。見事正解なされた方はおめでとうございます。コンピュータにとってはこれは結構難問なのです

私たちにとって鹿といえば『なんだか角が生えてて体に斑点模様がついてる生き物』というふんわりした認識がありますが、コンピュータにそれを伝えても正解には辿り着けません。そもそもこのイラストの鹿には斑点がありませんし。

そうして考えてみると、人間がこのイラストを見てどうして鹿だと認識することができるのか不思議に思えてきます。じっくり見ていると何か奇っ怪な模様にも見えてきます。そもそもどうやってこの平面の画像から背景と動物を切り分けて見ることができているのでしょう。よく見るとこの鹿は地面から浮いているような気もしますし鹿以外の何かという可能性の方が高いかもしれません。それなのになぜ私たちはこの画素の集合のしかも特定の部分を鹿と認識するに至ったのでしょう。

と、そのような特徴量検出の闇の話はともかく、CenceptNet4はこの問題の正答率はまずまずだったようです。先行きが不安になる正答率ですが、続いての問題です。

第2題:語彙問題

この問題は画像に示された対象物が何であるかを特定する問題です。

では問題です。

これはなんでしょう。
kitten

これはなんでしょう

一体これはなんなんだ……。

image by

Getty Images

正解は猫です。見事正解なされた方はおめでとうございます。さっきの問題から画像と名前が逆になっているだけなのでやはりこれもコンピュータには難しい問題です。しかしこちらはどういうわけかConceptNet4は情報問題よりも高い正答率を得ることができたようです。対象物が少ないのが幸いしているのでしょうか。どちらにせよさすがはMITというところでしょうか。

しかし先日も黒人の男女が映った画像をGoogle photosがゴリラと自動認識して開発者が謝罪する事件が起きているので、今でも画像に映った対象を特定する問題にはまだまだ課題が残っているようです。

さて、続いての問題です。

第3題:類似問題

この問題は問題文に挙げられた二つの対象物に共通する上位概念を抽出する問題です。

では問題です。

空欄に当てはまる単語を答えよ。

キュウリとトマト、どちらも__である。
vegitable

キュウリとトマト、どちらも__である

この二つの共通点は一体なんなんだ……。

image by

Getty Images

正解は野菜です。どちらも果実を食用とする野菜なので『果菜類』もアリでしょう。『緑黄色野菜』はキュウリが該当しないので不正解になります。『美味』は個人の裁量なので△にでもしておきましょう。見事正解なされた方はおめでとうございます。

さておき、これもコンピュータにとってはやや難しい問題です。キュウリといえばどのようなイメージが浮かぶでしょう。『野菜』がまず挙がりますが、他にも『植物』『緑色』『細長い』『果実』『水分豊富』『表面がデコボコしている』『ウリ科』『花が黄色い』『栄養がほとんどない』などが挙げられます。

対してトマトは『野菜』『植物』『赤い』『丸い』『リコピン豊富』『水分豊富』『潰れやすい』『ナス科』『果実』『表面がツルツルしている』と、簡単に浮かぶのはこんなところでしょうか。

さて、私たち人間はこれらの特徴から即座に『野菜』(あるいは果実)という共通項を見つけることができますが、コンピュータは最も単純な作りのものであれば全組み合わせ総当りで共通項を見つけます。どちらも10個の項目があるので共通項を探すために最大で100回のトライ・アンド・エラーをします。

なぜそんなに無駄なことを、という気がしますが、逆に考えてなぜ私たちは『キュウリもトマトもどちらも野菜である』と即座に共通項を見つけることができるのでしょう。そもそも直近の上位概念を答えるのなら『果菜類』がより精度の高い答えになるはずです。それなのに『果菜類』でもさらなる上位概念の『植物』でもなくほとんどの人が『野菜』と挙げるはずです。これはなぜなのでしょう。

もちろん使用頻度の高い言葉だから思い浮かびやすいという理由があるわけですが、それならば『救急車』と『ファミリーコンピュータ』の共通項を見つけろと言われた時に『どちらも赤白で構成されたカラーである』と即座に浮かぶのはなぜでしょう。それは私たちが見たことのあるものは単語を言われた時にその姿を思い浮かべるからですが、なぜ思い浮かべるのでしょう。そもそも思い浮かべるということはどういうことなのでしょう。

画像が思い浮かぶのなら紙と鉛筆を渡された時に即座にそのイメージを書き写すことが出来るはずです。それなのにそれができないのはなぜなのでしょう。なぜ私たちはパンダの絵を描いた時はその色の配置を再現できないのに間違った色の写真を見せられた時に即座にそれが違うものだと理解することができるのでしょう

panda image by

Getty Images

さらに言うのならばこれらのイメージをどうやって私たちは取得するのでしょう。この答えは簡単で、学習によってです。『野菜』という概念を知り『緑色』『赤色』『デコボコ』『表面』『水分』という概念を知り、そして観察によってその概念が『キュウリ』『トマト』に当てはまるものだと関連付けます。

そしてその観察がコンピュータにとってどれほど困難なことでしょう。先ほどの問題からわかる通り、コンピュータには多数の動物を並べられただけでどれが鹿であるかを理解するのでさえ困難な仕事です。さらに言うなら『緑色』の範囲はどこからどこまででしょう。RGB値でいえばどこからどこまででしょう。そしてそのRGB値の範囲はなぜ全人類共通でしっかり決まっていないのでしょう。そもそもにしてそれらの学習を一体誰がさせるのでしょう

今はかなり不完全ではあるもののインターネットを駆使して自らコンピュータが学習することはできるようになっているでしょうが、間違いもたくさん出てくるので手打ちが多くの場合必要になってきます。

トマトは野菜で赤くて表面がつるつるしていて水分が豊富で、それでもって野菜よりも植物という概念が上位概念で、でも野菜の方がトマトにとっては頻出概念であって、ということを教えこまなければいけないのです(さすがに今はそんなことはしていないでしょうが、どちらにせよ概念の関係性を簡潔に捉えるためのプログラムが書かれているわけです)。考えるだけでゾッとします。

そんな検索システムの闇は置いておいて、この類似問題、ConceptNet4は高い正解率を出すことができたようです。開発者らの苦労が窺えます。

さて、続いての問題です。

第4題:推論問題

この問題は三つの条件、あるいは特徴からそれらを有した対象、概念を推論し導く問題です。

では問題です。

「オスにはたてがみが付いています」
「アフリカに住んでいます」
「大きくて黄色がかった茶色のネコ科の動物です」

さぁ、この動物は一体なんでしょう。
lion

さぁ、この動物は一体なんでしょう

この動物は一体なんなんだ……。

image by

Getty Images

正解はライオンです。見事正解なされた方はおめでとうございます。抽象的な特徴から具体的なものへ向かう問題なので先ほどの問題の順序が逆になっただけとも考えられますが、この問題はコンピュータにとってかなり難しい問題のようです。さすがのConceptNet4もかなり低い正解率となってしまいました。

概念学習の難しさは先ほど挙げたので省略しますが、なぜ順序が逆になっただけでこれほど正答率が違うのか記者もわかりません。研究者もよくわかっていないようです

というのも先ほど挙げた問題は実際にConceptNet4に出されたものなのですが、ConceptNet4が出した答えは「候補を可能性が高い順に5つ挙げると、農場、生き物、家、あとネコ」という全くもって意味不明な答えだったからです。

研究者はこの答えに対して「ネコ科って言ってるんだからネコに類する答えを挙げるはずなんだが……」とコメントを残しています。少し前にGoogleの作った人工知能『DeepDream』によって生成された画像がほとんど犬になるという事件があったことを考えると人工知能は犬派なのかもしれません。

さて、続いては最後の問題です。

最終問題:解釈問題

この問題は問題文に示された一般的な行動や事象に対してその理由や事象が起きる場所などを答える問題です。

では問題です。

血も涙もない人とはどんな人ですか。
cold-blood

血も涙もない人とはどんな人ですか

一体どんな人なんだ……。

image by

Getty Images

正解は強いていうならば「冷たくて人情がない人」となるでしょう。これに類する答えを挙げた人は正解です。見事正解なされた方はおめでとうございます。コンピュータにとっては難しい問題です。

よほどひねくれた人でない限り「からっからに乾いた人」と挙げる人はいないと思われますが、コンピュータはマジメにそんな答えを返す可能性があります。

実際に出題された問題は“Why do people shake hands?”というものでした。日本語に訳すのなら『なぜ人々は握手(shake hands)をしますか?』というところでしょうか。やや無理のある質問のような気がしますが出題者の想定した答えは「感謝」「友人と会った」などでした。しかしCenceptNet4はこの問題文を『なぜ人々の手は震え(shake)ますか?』とも捉え、その結果『てんかんの発作』と答えました。CenceptNet4は慣用句や熟語を知っていたとしてもそれが今その意味で取るべき時なのかわからなかったのです。

近い日本語の問題として『ぎなた読み』が挙げられるでしょう。たとえば『きょうふのみそしる』という文字列を見た時、私たちは『今日、麸の味噌汁』『恐怖の味噌汁』の二つの日本語を思い浮かべます。そこそこに常識のある人ならば『さすがに恐怖の味噌汁はないな』と判断し『あぁ、今日は麸のお味噌汁なんだな』と理解することができますが、さて、常識とは一体どのようにして身に付けていくものなのでしょう

baths

この種の問題でもっとも有名なものは「ねえちゃんとふろはいってる?」という質問文であろう。ただし、この質問をコンピュータにしたところでどちらの読み方をしたとしても答えは「No」なので少々面白くない。

image by

Getty Images

どのようにして私たちは『大きな栗の木の下』と言われたら『栗が大きな木』ではなく『木が大きい』と判断し、『木綿のハンカチーフ』と書かれていたら『木綿(きわた)さんのハンカチ』ではなく『木綿(もめん)のハンカチ』あるいは『太田裕美の曲』と判断するのでしょうか。そしてどのようにして対話者が『木綿のハンカチ』の話をしているのか『太田裕美の曲』かを判断するのでしょうか。相手の年齢でしょうか、趣味でしょうか、あるいは話題の流れでしょうか。これらの複合的で曖昧な要素からコンピュータが正しい答えを出すことは至難の業なのです。

もちろん、CenceptNet4の正答率は低いものでした。そういえばドラえもんの名作映画『ドラえもん のび太と鉄人兵団』にてドラえもんの道具によって知能を持ったラジコンロボットに対してのび太が「『こじか』と『おやじか』のどちらが大きいか」というまさにこの問題と全く同じ種類のなぞなぞを出すシーンがありました(『子鹿』よりも『親父蚊』の方が大きいため子鹿の方が大きい、というオチでした。また、同種の問題をもう一題出すことでこのロボットはショートを起こしてしまいます)。22世紀の人工知能でさえ混乱する問題なのだから21世紀の人工知能のConceptNet4が苦労するのも無理はないのかもしれません。

結果

これらの五種の問題を解いてもらったところ、CenceptNet4のIQは四歳児程度という結果が出ました。MITの粋を集合した人工知能が四歳児レベル……。なんだか少しガッカリしますが、ConceptNet4が作られたのは2012年。現在は既にCenceptNet5が完成しています。ConceptNet5でのIQテストはおこなわれていないようですが、恐らくConceptNet4よりは良い結果を出せるはずで、もう少しは高い知能を持っているかもしれません。

現在、日本でも『東ロボくん』と名付けられた東京大学の入学試験に合格するための人工知能が開発されています。東ロボくんが東大に合格する予定の年は2021年なのでもし計画通りに東ロボくんが東大に合格すれば2012年に四歳児程度だった知能がわずか9年で18歳の中でもトップクラスの知能を持つこととなります。一年につき1.6歳の知能の上昇が見込めるということは『強い人工知能』つまり意識を持ったロボットが生まれるといわれる2053年には約70歳程度の知能を持っていることになります。すごいのかすごくないのかよくわかりませんね。

というのはともかく、このテストは人間に合わせたものなわけで少々意地の悪い実験のように思えます。コンピュータにはコンピュータの得意分野があり人間には人間の得意分野があるわけで、それなのにわざわざコンピュータが人間に合わせるようなことをしなくても、と思ってしまいます。コンピュータと人間の立場を逆にしたら「どんなに賢い人間でも計算能力でファミリーコンピュータの足下にも及ばない」と言われるようなものです。

もし本当に強い人工知能が生まれて人間が支配された時に「あの時の恨みはらさでおくべきか」と、ひたすらそろばんを叩かされないか少し心配です。

REFERENCE:

IQ Test Result: Advanced AI Machine Matches Four-Year-Old Child’s Score | MIT Technology Review

IQ Test Result: Advanced AI Machine Matches Four-Year-Old Child’s Score | MIT Technology Review

http://www.technologyreview.com/view/541936/iq-test-result-advanced-ai-machine-matches-four-year-old-childs-score/

ロボットは東大に入れるか。Todai Robot Project

http://21robot.org/