実際のAIって、なんだか思っていたのと違う気がする……その違和感や不安はなぜ起こる?AI開発者・三宅陽一郎が解説

 いまや必要不可欠なインフラとして急速に広まりつつあるAI。しかし実際のAIは、「人工知能」と聞いてイメージするものとなんだか違うような気がする、という方も多いのではないだろうか。AI技術の発展によって、将来的に「シンギュラリティ」が起こるのではないか、との不安もある。
 このギャップが生まれているのは、その出自も発展過程も異なる「技術としてのAI」と「エンターテインメントとしてのAI」が、まだほとんど結びついていないためだ。それはどうすれば橋渡ししていけるのか?
 以前に電ファミでも取材したAI開発者・三宅陽一郎氏が、12月16日に発売される新著『人工知能が「生命」になるとき』(※12月15日までは全4回のオンライン講義付きで先行販売中)にて、その問題に挑戦する。本書は、今まで機能的に扱われがちだった人工知能に、どうすれば認識や感情を持つ「生命」をもたせることができるのか?というスリリングな問いを試みたものだ。
 本稿は、電ファミの読者諸兄諸姉にも親しみやすい「ゲームAI」に関する話題を中心にして、その内容をリミックスしたものだ。「遅いインターネット」にてその一部が公開されていたが、本書を発行するPLANETS編集部のご厚意により、電ファミにその完全版を掲載させていただくこととなった。ぜひじっくりとご覧いただきたい。(編集部)

『人工知能が「生命」になるとき』購入はこちら


「人工知能」のイメージをめぐる違和感

 皆さんが「人工知能」という言葉を聞くときに、あるいはその説明を受けるときに、何か胸の中で違和感を抱いたことはないでしょうか?
 特に2010年代前半から現在にかけては、ディープラーニング(深層学習)技術のブレイクや「IBM Watson」などを通じて、たくさんの実用的なAIの可能性が切り拓かれてきました。けれども、多くの人にとっては「何だか思っていた人工知能と違う」「自分の直感に反する」「大筋はわかるけれど、何か違う気がする」という感想を、呼び起こしてはいないでしょうか?
 私自身も感じる、そんなちょっとした違和感の正体は、日本の持つ社会・文化の様相が、西洋の思想的土壌の上に発展した工学技術としての「人工知能」と、少なからず対立・矛盾することに起因するように思われます。そして、その違和感は、「人工知能」の社会的導入が全世界レベルで起こるにしたがって、ますます大きくなり、多くの人を不安にし、暗黙の我慢を強いているように思います。

技術としてのAI、エンターテインメントとしてのAI

 人が人工知能と聞いてまず想像するのが、一つの「生命」のような人工知能ではないでしょうか。わかりやすく言えば擬人的なキャラクターです。人は、人間や動物とよく似た外見のものには、自分たちと同じ知能を見出そうとします。
 しかし、そういったイメージに関して、人工知能の工学的な研究者の多くは、否定的な立場を取ることが多いです。人工知能は長らくアルゴリズムや情報処理に還元されることで学問の姿を取ってきており、ひとつの生物個体のような全体性をもった人工知能を構想するのは、まだまだ時期尚早だと捉えられているためです(現状、そのようなアプローチは、個体をごく単純にモデル化した「エージェント指向」と呼ばれる人工知能の一分野として限定的に探求されています)。

 一方で、ゲームのようなエンターテインメントで使われるAIは逆の立場を取ります。エンターテインメントAIは常にユーザーの主観上、体験の上に「知能」としての存在を表すことを目的とします。知的な存在、楽しませる存在、愛らしい存在など、多様性に富んでいますが、ユーザーに感じてほしい知能のイメージを確定させてから、そのための外見、振る舞い、知的能力を逆算して作っていくのです。そのような人工知能は、学問としての人工知能研究者から見れば、表層的なものを志向した、見掛けだおしで「中身」のない人形に過ぎない存在とも言えるでしょう。

二つの人工知能を橋渡しするために

 もちろんどちらも同じくコンピュータプログラムであり、まるで違う技術というわけではありません。しかし、エンターテインメントAIが想定するような生命のような人工知能は目標へのハードルが高すぎて、専門家であればあるほど否定的な態度を取らざるをえなくなる、というのが現状です。

 けれども、だからこそ私はエンターテインメントAIが目指す文字通りの「絵に描いた餅」のような人工知能と、専門的な技術分野としての人工知能を、長い時間をかけて橋渡ししていきたいと考えています。「人とそっくりな人工知能」はすぐには実現できないにしろ、我々が遠く求める究極的な人工知能の姿として、また目指すべき一つの方向として、研究開発に携わる人々が分野を超えて、さらに協働的に追求されていくことになるでしょう。
 アカデミックなAI研究が、機能的な要素を積み上げて人工知能を構築するという方向からのアプローチであるのに対し、エンターテインメントAIは、人が求める人工知能像から逆方向に遡っていくアプローチになっており、この二つは相補的な関係にあります。両者は今のところ細い橋でつながっているようなものですが、たくさんの橋を渡していくことで、やがて大きな橋となり陸となり、人工知能の姿を大きく変貌・進化させることになっていくことでしょう。しかし、現在のところ、それは細い細い橋でしかありません。

▲人々が人工知能に求めるイメージと人工知能の技術を結ぶ架け橋

 そして目下、このか細い橋をかけ続けるような仕事が、私がデジタルゲームの人工知能で行おうとしていることなのです。
 たくさんのゲームのキャラクターの知能を作りながら、キャラクターの知能とアカデミックな人工知能の知識を融合させることで、少しずつですが新しい可能性が見えてきました。これは言い換えれば、日本で育まれた擬人的なキャラクター文化と、西洋で育まれた人工知能を融合させることです。西洋が技術を、東洋がイメージを提供し合うことで、生命としての人工知能という分野が躍進するのではないか。

 本稿では、ゲームAIの考察を通じて、この二つの領域を結びつけていくための道筋をご紹介したいと思います。この二つの領域の間にある空間にこそ、人工知能の本来的な、人間の知性にとって本質的で興味深い知見とテクノロジーがたくさん横たわっていると私は感じており、そしてそのいくつかを掘り起こしてみたいと思っています。


持ち場(テリトリー)を与えられていた初期のゲームAI

 ゲーム開発の最初には、そのゲームの中で、どの部分までを人工知能に担当してもらうか、どこを人間がセットアップするかを決めます。人間がプリセットする行動命令(スクリプトと言います)を書いて、どこまでを人工知能の自律的意思に任すかを決めます。
 たとえば、1980年代のファミリーコンピュータ(ファミコン)の頃のゲームを思い出してみましょう。ファミコンのゲームのキャラクターたちは自分の持ち場(テリトリー)が決まっていて、キャラクターが現れると一定のパターンの攻撃をくり返します。これは、お掃除ロボットを動かすために空間を空けておく、のと同様です。
 ゲームのキャラクターは常に明確な役割を持ちます。プレイヤーにダメージを与えるとか、プレイヤーを足止めしたあとにやられてアイテムを落とすといったことです。それらのキャラクターは、マップのエリアごとに設定され、さらにその中の各キャラクターは持ち場(テリトリー)が与えられ、与えられた役割をこなし、ゲーム全体を繋いでいくのです。つまり「局所的に限定された人工知能」をつないで「全体の人工知能」を作っていると言えます。また、そういった局所を「キャラクターの縄張り(テリトリー)」と解釈してうまくゲームデザインと整合性をつけていたのです。

▲キャラクターの持ち場(テリトリー)とそのつながり

ボードゲームの盤面認識とルールに則した「思考エンジンとしてのAI」(キャラクターAI)

 囲碁、将棋はどうでしょうか。こちらの人工知能はデジタルゲームのような敵キャラクターの人工知能ではなく、相手プレイヤーの役割をする人工知能ですが、一個の盤面をひたすら深く探索します。碁盤はとても広いので、碁のAIは、必ずしも盤面全体を考慮しているのではなく、局所的な形を見て打っています。ですから、局所的な思考を繋いでいるとも言えます。しかし、碁の上級者であるほど、より広い局面を見ながら打つようになります。つまり局所を見ながらも大局を考えながら、さらに局所を打つ、というマルチスケールの間を行き来しながら思考する、複雑系の思考が必要とされます。将棋も同様に局所的な形を見て指す場合もありますが、盤面全体が狭いために、多くは盤面全体を考慮した手になっています。

▲碁盤の上で局所的に繋いでいく

 アルファ碁をはじめとするディープラーニングを用いた碁AIが強いのは、前述した「畳み込みニューラルネットワーク」が入っているからで、このニューラルネットワークはマルチスケールに盤面を解析する力があります。
 最初は2×2、次に4×4、8×8、のように、段階的にスケールを上げながら解析して各スケールに応じた特徴を抽出します。つまり、局所からだんだん大局に向かっていくマルチスケールな局面解析が可能なのです。そのせいもあって、学習に計算量(時間)がかかりますが、棋譜データが多ければ多いほど、深く局面を学習できます。実際、アルファ碁から次の「Master」は、何千万という盤面データを学習し、盤面を直感的に捉えられるような知能を獲得しています。
 このように、与えられたルールに則して人間とプレイヤーと同じ立場で、局面に応じてプレイの中身を自律的に判断する思考エンジンとしての役割が、現代のゲームAIには与えられています。こうした意思決定を担うタイプの人工知能を、「キャラクターAI」と区分することができるでしょう。

ゲームフィールドと環境を統べる「仕組みとしての人工知能」(メタAI)

 一方で、将棋や碁のようなターン制の相互手番型ゲームの延長線上に、デジタルゲームではさまざまなフィールドが築かれています。一番印象的なのが『シムシティ』など都市の育成をテーマにした、リアルタイム型のシミュレーションゲームでしょう。『シムシティ』は、ユーザーが工場や発電所、消防署、警察署といったインフラを整備していくと、自然に街が発展していくゲームです。

▲ SimCity Buildit(EA, 2014) (筆者のプレイ中の画面です)

 こうしたフィールドの生成発展を担うのが「仕組みとしての人工知能」ないし「メタAI」で、ユーザーのアクションに応じて自動的に街を発展させていきます。
 この自動生成は、次のような仕組みで行われています。まず、『シムシティ』の街のマップは全体がグリッド状のマス目で細かく分割されており、ユーザーはそのどこかのマス目に対し、建物を建設したり道路を敷設したりといったアクションを行います。
 すると、入力を受け取ったAIは、ユーザーのコマンドに応じた処理結果をそのマス目に出現させるとともに、そこで起こった事柄を周囲のマス目に波及させていきます。

 このときにAIが処理する影響の範囲が、ミクロなスケールからマクロなスケールまで階層的に設定されているのが、『シムシティ』の特徴です。つまり、ユーザーのコマンドを受け付ける一番小さなスケール(エディット・ウィンドウ)を最上層に、その影響が一定範囲に及ぶと、より大きなスケールを扱う第二階層に影響が及び、さらにまとまると第三、第四と大きなスケールの階層へと影響が積み重ねられていきます。ここで各層で処理されるグリッドの範囲は、上層ほど細かく、下層になるほど広い範囲を覆うようになっています。
 このような手法を「影響マップ」(Influence Map)と言いますが、シムシティでは影響マップを多層的に積み上げた方法が取られています。つまり、各スケールの階層内での水平的な影響の伝播と、上下の階層間での異なるスケール範囲での影響の伝播という、2つの方向で影響が双方向的に伝わっていきます。
 空間的な影響範囲の大小だけでなく、それぞれの階層の影響は時間単位も異なっており、上層の小さなスケールの影響は素早く、下層の大きなスケールになるほど、ゆっくりと影響が波及します。そのようなユーザーのコマンドを起点とする小さく細かい影響が徐々に大きく重なりながら上層から下層に伝わり、一方では逆に下層から上層へも各層の影響シミュレーションの結果が加算されながら伝播してくるので、最上層ではこのような全層でのシミュレーションの時間分を経てから影響が現れます。
 このような手順で、『シムシティ』の街の自動生成は行われています。

▲『SimCity』における多層階層の影響度マップ
参考: ウィル・ライト著、多摩豊訳『ウィル・ライトが明かすシムシティーのすべて(コンプコレクション)』角川書店、1990年、pp.46-49

デジタルゲームのフィールドとキャラクターを媒介する「ナビゲーションAI」

 以上のようにデジタルゲームで描画され、自律的に発展するフィールドは、ボードゲームのように平坦ではありません。山や湖といった多様な地形があり、物や岩や植物(オブジェクト)があります。そのようなさまざまな場所にある地形を利用して行動するためには、どのような地形でも認識して行動に活用できる、より汎用的な人工知能が必要です。しかし、このような汎用的な知能の実現は現時点ではとても難しいものです。こういう時、人工知能では、より小さな人工知能に分けて協調させることで実現する、というアプローチがあります。これを「分散協調人工知能」と言います。
この場合は、意思決定を行うキャラクターAIと、地形の認識を担当するナビゲーションAIに分割します。ナビゲーションAIが担当するのは、

 (1)どこを歩いて良いか(ナビゲーション・メッシュ)
 (2)どのオブジェクトにどのような行動を取ることができるか(アフォーダンス)

 という処理です。広い意味では、(1)もアフォーダンス情報に入りますので、ナビゲーション人工知能は端的に言えば、環境世界のアフォーダンスを抽出し、キャラクターに与える役割を持ちます。ナビゲーションAIは「環境とキャラクター人工知能を結ぶ」役割を果たしているのです。

▲ナビゲーション人工知能の役割

オープンワールド時代に対応して複雑化した現代のゲームAI

 現代のゲームは、オープンワールド型が主流になりつつあります。『Fallout』『Skyrim』(いずれもBethesda Game Studios)、「グランド・セフト・オート」(Rockstar Games)シリーズなど一千万本を超えるシリーズは、いずれもオープンワールド型ゲームです。オープンワールド型ゲームとは、広大なマップを持ち、シームレスに移動可能で、基本的にどの場所でも行けて、どのようなことをしても良いというゲームです。もちろん、ゲームによってミッションの順番やオープンになっていない場所があるなどの違いはありますが、ユーザーに最大限の自由度が与えられているゲームのことを言います。
 感覚としては『バンゲリングベイ』(ハドソン、1985年)と似ているかもしれません。『バンゲリングベイ』は後に「シムズ」「シムシティ」シリーズを大ヒットさせることになるウィル・ライトが作ったゲームで、本人の談によるとオイルの色が川の色と同じで透明色になってしまったので、よくわからないゲームになってしまった、とのことです。私もマップの隅々をヘリコプターで飛び回っては敵基地のようなものを破壊していましたが、何のために何をやっているのか最後までわかりませんでした。しかし、あのどこに行ってもいい、何をしてもいい、というゲームの中で放り出された気持ちは現代のオープンワールドゲームと似ているかもしれません。
 ゲームが広大になると、そこで活躍するための人工知能は、一定の場所でのみ活動する制約された人工知能と違い、いたるところで知的な活動を求められます。一緒に旅する仲間など、広大なマップに適応する人工知能はより汎用的な人工知能である必要があります。その知的構造はとても大きく深いものになります。たとえば、『ディビジョン』(Ubisoft, 2016)のキャラクターAIの内部構造は巨大なものになっています。

 それぞれのキャラクターが持ち場を持ち、その中でキャラクターを動かそうとするときには、問題を限定することができます。逆に、切り分けた問題ごとにキャラクターを割り当てるとも言うことができます。人工知能が解くべき領域のことをフレームと言います。フレームの中で設定が多くなるほど、そしてフレームが広くなるほど、人工知能が抱える問題は重たく深くなります。それはそのままコンピュータの負荷に直結します。オープンワールドのゲームでは人工知能が持つフレームをどんどんと人間が広げてあげる必要があります。
 しかし、フレームを広げていけば、それを抱える人工知能の内部構造もまた必要となります。すると、その内部構造自体が、それ自身の制限を持ち始めます。つまり、フレームを単純に無限に広げていくことはできません。知能の内部の統一性を保ったまま広げるためには、段階的な組み換えが必要とされます。それはちょうど我々人間が子供から思春期を経て大人になる苦悩と似ています。その道のりは決して線形でも平坦でもありません。
 同じように、人工知能は最初に獲得した知能の形をある程度保持しつつ賢くする必要がありますが、それはとても難しい過程です。プログラマがプログラムを書いて拡張する時でさえ、元のプログラムとの整合性を気にしながら書かねばなりませんし、それが不可能な場合には全面的に書き直すことすら珍しくありません。つまり人工知能は構造的な進化を経て、より高度な存在になっていきますが、それは根本的な改革であるがゆえに、単なる適応型学習では実現することはできません。

 ゲームキャラクターの人工知能はゲームのオープンワールド化に伴い、直面する世界が深く広くなる「フレームの拡大」に直面してきました。ゲームが当初の仕様を超えてどんどんと拡張して作られていくのが普通ですので、最初の仕様は基礎にはなっても、すべてではありません。そこで、ゲームAI技術は柔軟に自身を変えていける仕組みを自らの内に持つ必要があります。

▲フレームの拡大に応じて拡張するビヘイビアツリー

ゲームAIに求められる三つの方向性

 その仕組みに必要な性質が、「拡張性」「多様性」「カスタマイズ性」の三つです。この三つを兼ね備えることで、さまざまなキャラクターの人工知能を統一されたシステムの中で構築することが可能になります。同時にそれは人工知能の汎化(汎用性)を高めることになります。つまり、ゲームの開発スタート時にそのゲームで要求される人工知能の構造を決定し、その構造の中で、この三つの性質を持つように設計しておくのです。

▲デジタルゲームAIに必要とされる三つの方向性

 その一方で、現在の実用的な人工知能技術の基盤になっているニューラルネットワークは、柔軟な学習手法ではありますが、必ずしも拡張性に優れているとは言えません。一度学習してしまうと、次の学習は前の学習を上書きしてしまいますので、そうしないためには、もう一度全体を学習し直す必要があるからです。つまり拡張性はありますが工夫の必要があり、カスタマイズ性がとても低いのです。

 逆にニューラルネットワークの長所は、自律型の学習機能にあります。環境の情報をリアルタイムに取得し続けるパーセプトロン型のニューラルネットワークは、ディープラーニングの場合は特に、自分の内部に世界のダイナミクスを写すことができ、そのダイナミクスから出力を生成することができます。その際には、何が正解かを人間が指定する場合を教師あり学習、環境からの反応によって学習する場合を強化学習と言います。

▲環境のダイナミクスを写し取るニューラルネットワーク

 人工知能が直面する世界が広く、深くなるほど、人工知能もまたその内面を広く、深くする必要があります。世界の複雑さそのままではないにしろ、それに対応する内面を持つ必要があります。
 ゲームキャラクターがゲームの中で理解する必要があるのは、環境(空間、時間変化)とストーリーです。世界を深く理解するほど、そのキャラクターはその世界に深く存在することになります。従来の「世界のギミックの一部となる」、つまり物理的に埋め込まれているだけでなく、キャラクターは自律性をもった精神的(知能的)存在として、自ら「その世界に属する」ことが必要となります。世界にきっちりと根を張る必要があります。
 しかし、世界がより広く、深く、ストーリーが巨大なものになればなるほど、キャラクターの知能はより大きく深いものと直面することになります。それを考えることは、ゲームに限らずこれからの人工知能の未来を考える上で、とても重要なことです。

 世界の中にある人工知能という視点から眺めてみましょう。世界から突きつけられるものは、まず物理的な現象です。ボールが飛んできたり、剣が振り下ろされたり、そういった物理的な事象に対応する知能というものがあります。これを物理レイヤーと呼びます。
 次に、より長い時間の状況の変化があります。物理的な対応をしていただけではわからない、戦術的な状況の変化です。味方の基地を防衛したり、敵の城を攻めたりという現象の次元です。これを戦術レイヤーと呼びます。
 さらに、より大きなミッションや使命というものがあります。ゲームの中で果たす役割、というものです。それはとても抽象的なもので哲学的なものです。たとえて言うならそれは、我々人間が「この世界で生きる意味」を求めるのと似ています。これを意味レイヤーと呼びます。

 このように、物理レイヤーから意味レイヤーまで、ゲーム世界に直面するキャラクターはさまざまなレベルで世界に参加します。このレベルが深ければ深いほど、高度な人工知能が求められます。
 キャラクターがより深く世界と関わっていくとき、人工知能に求められるものは何か? そのときのキャラクターの知能の構造は、どのように深化する必要があるのか? それこそがデジタルゲームにおける人工知能の最も重要なテーマの一つです。

▲ゲームのキャラクターが直面するさまざまなレイヤー

キャラクターAIに認識や感情を持たせるには

 以上のように、ゲームAIの場合には、きわめて具体的な世界の状況に対してキャラクターの知能を形成していきます。そして、高度なキャラクターの場合には、何重にもフレームを重ねることで、より複雑な意識を形成することになります。
 では、キャラクターAIに感情や不安や希望といった精神活動をどのように実装できるのでしょうか。現行の技術の延長線上で考える場合、それは世界の見え方の中に定義することで実現します。
 たとえばキャラクターAIには、敵キャラクターに対しての「脅威度」というパラメータを持たせることができます。これは敵キャラクターが持つ体力や魔法力などと言った客観的な指標ではなく、今、その状況下で、敵キャラクターがどれぐらい自分なり守るべきキャラクターに対して大きな危害を加えそうか、と言った予測値となります。この脅威度によって最初に攻撃する敵キャラクターを決定します。また、土地に対する感覚があります。先の例では自分の陣地に「守るべき土地」というラベルを付けます。このようなラベルのことをゲームAIでは「タグ」と言います。
 街の大通りには「騒がしい」「楽しそう」というタグを付けますし、薄暗い広場には「さびしい」「危険」というタグを付け、深い森の中の道には「暗い」「見通しがよくない」などのタグを付けます。このようなタグはキャラクターAIの行動を形成するときに利用されます。このように世界の見え方を定義することで、キャラクターAIの意識や精神の状態を規定していきます。たとえば、仲間が同じ街にたどり着いて散歩するとしたら、より「楽しそう」なタグがついた場所をめぐる、という行動を取らせることができます。

 もちろん、本来の精神や意識は、このような人間が外から与えるタグではなく、環境と内面の相互作用によって自律的に形成されるのが理想的です。しかし、そのような自律的、かつ自発的な精神の活動を、人工知能はいまだ獲得していません。そのような活動は、身体なくしてはあり得ないものでしょう。
 たとえば、ある場所に入ったときの明るさ、香り、湿気、空気(風)から、人はその場所に対する印象を形成します。そして、そこから自分自身の身体や精神に及ぼす影響を予測し印象を決めます。キャラクターAIで言えば、自らタグを形成します。そのような自律的ダイナミクスを持つ人工知能を作っていくことが、これからの課題になるでしょう。

 ただし、それぞれの人工知能がそのようなダイナミクスを持って自律的な活動を獲得すればするほど、逆に言えば扱いづらくなります。自律性と可制御性はトレードオフの関係にあります。フレームが完全に想定される問題に対しては、自律性の弱い可制御性の強い人工知能に対応させるのが良いでしょう。現在のほとんどの人工知能はこの形になっています。
 しかし、フレームの内容が高度で複雑な場合には、自律性が強くて可制御性の弱い人工知能の方が適しています。そして、その場合に、どのような身体の、そして精神の自律的なダイナミクスを持たせれば良いかという問題は、まだ十分に研究されていません。

人工知能のカオス存在理論

 環境を巻き込み、巻き込みつつ行動を生成するダイナミクスこそは、人工知能の特徴そのものです。身体レベルでは、このダイナミクスを散逸構造と言います。エネルギーを得つつ、消費し、エネルギーを出すことで、生物は身体の動的平衡状態をかろうじて保っているのです。人間の知的活動も同様の散逸構造を持つ運動であり、カオスや熱力学や統計力学、刺激や情報の流れと自然な関連を持ちます。人工知能も同様であり、これらの技術との深い関連の中で、再構築されようとしています。
 これは大きく見れば、単純な機能を相互に連関させていくことで混沌を獲得する「自律型カオス力学系」と呼ばれる手法の一つに分類できます。

▲多数の要素が相互作用し発展する「力学系」のイメージ

 力学系とは「絡み合う複数の要素が時間と共に変化するシステム」のことです。特にこの力学系が「繰り返す動的な運動をボトムアップに持つ」場合には「自律型力学系」、さらに、外界からのインプットに関してセンシティブ(鋭敏)に運動を変化する場合に「自律型カオス力学系」と言います。イメージとしては、天井から吊り下げられたたくさんの振り子がお互い細い糸でつながれている場を想像しましょう。いくつかの振り子を力強く動かすと、力が伝搬して全体として複雑な振り子運動が生成されます。振り子は現実の物理空間の中にありますが、「自律型カオス力学系」の法則性を数学的に解析するためには、より抽象化された物理量で構成される位相空間を用いて記述する必要があります。これが、自然界に存在する一般の力学系のモデルです。
 これと同様、私自身も知能を「外部環境と内部構造の相互作用による情報の混沌の中から自律生成されるカオス力学系」とみなして人工知能を構築するという試みに長い間関わってきました(これは私の博士課程の頃からのテーマでありました)。現在も続けていますし、またこれからもこの手法が最も有望であると感じています。

 混沌からの人工知能を生成するもう一つのアプローチとしては、「リカレント・ニューラルネットワーク」を用いることが考えられます。
 ニューラルネットワークとは脳の神経回路を模した「電気回路シミュレータ」です。通常、ニューラルネットワークは多層構造を持っており(パーセプトロン型)、入力(感覚)から出力(判断)に向かって信号が進んでいきますが、リカレント・ニューラルネットワークでは、出力を入力にもう一度戻します。こうすることで出力と入力が混じり合い、感覚と判断が、あるいは客観と主観が混じり合うのです。
 こうしてリカレント・ニューラルネットワークを動かしていると、次第に、このリカレント・ニューラルネットワークを構成する要素の間に「自律型カオス力学系」が出現します。正確には、その場合、ニューラルネットワークは少し複雑な構造を持つ必要がありますが、本質的には自己ループバック構造と世界とのインタラクションの中からカオスが生まれます。

▲リカレント・ニューラルネットワークと自律型カオス力学系

 ただし、こうしたアプローチは人工知能研究の中に閉じているかぎり、とても数学的でトリッキーなものに見えてしまいます。このアプローチにしっかりとした基盤を与えようとするならば、まず哲学の領域から土台を築く必要があります。それもより深い基盤として、東洋哲学的な思想の上に構築することが自然です。
 というのも「混沌からすべてが生まれる」という思想は、東洋哲学においてこそ根源的なものであるからです。知能を作るという試みの中では、東洋と西洋の二つの知見がおのずと必要になります。人工知能を作ろうとする行為は、まさにこの二つの世界の潮流を結び合わせる役目を持っているのです。

 それは我々の見方を逆転させることでもあります。混沌を人為的に構成する、という見方ではなく、まず知能とは混沌であり、その表現として「自律型カオス力学系」があるという見方です。ですから知能の根底である混沌を知ることこそが、知能を形成するための最大のヒントであり、それを「自律型カオス力学系」の力を借りて描き出す、ということでもあります。

▲人工知能と混沌、そして力学系

現代の人工知能は西洋的な秩序を超えはじめている

 人工知能がプログラムだけで書かれているなら、それは西洋の近代科学で規範とされてきたような要素還元主義的な構造と機能の秩序としてのみ理解すればよく、そこに東洋哲学的な混沌が入り込む余地はありません。実際問題として数十万行のプログラムを読解するのは至難の業ではありますが、第二次AIブーム(1980年代〜1990年代初頭)の人工知能までは、人工知能の思考は、ルール(記号主義型)やニューラルネット(コネクショニズム)の形として記述されていました。第三次AIブームの人工知能もプログラムやディープラーニング・ニューラルネットワークの形で書かれていますし、そこから逃れることができているわけではないので、原理的にはプログラムを解読していけば、人工知能のふるまいを決定論的に予測したりコントロールしたりすることは可能でしょう。

 しかし、第二次AIブームになくて、現在の第三次AIブームにあるものが、それを困難にしています。すなわちインターネットの登場です。世界中の人々が生成した大量のデジタルデータがサイバー空間に蓄積し、移送しやすくなったことで、第三次AIブームのAIの多くは、インターネット上の巨大なデータの学習を前提としています。そうなると、プログラムやニューラルネットというアルゴリズムではなく、それらが処理対象とする大量のデータを学習した結果を追っていかなければなりません。記号主義型のAIの場合は、それはIBM WatsonやGoogle検索などのような巨大なデータベースになり、コネクショニズムの場合は、それはニューロン結合率として保存されます。その精緻に分割され、調整されたデータ形式を、しかも気の遠くなるような膨大な量を追っていかなければならないため、もはや厳密な決定論的予測をすることが不可能な、いわゆる複雑系の領域に到達しています。
 それを把握しようとする行為は、ちょうど地表を高くから見降ろしたような、小さく複雑な地形が絡み合った風景を眺めるのに似ているかもしれません。つまり細部の厳密な観測や予測は諦めて、全体としての特徴や傾向を把握しながら、目的に沿うように試行錯誤しながらシステムを設計・調整していくのが、第三次AIブーム以降の研究開発の進め方になっています。

 このように、現在の人工知能は、すでに造物主と被造物をめぐる西洋の伝統的なヒエラルキー秩序から逸脱して、自然そのものの性格に近い、完全には理解しきれない部分を抱えつつあります。そうした予測不可能なデータ領域が人工知能の中で拡大し、さらにデータを処理するアルゴリズム自体も自己完結的に進化するようになるとき、AIは完全に人間の理解を凌駕し、コントロールの外に出てしまう可能性がある。西洋ではこれをシンギュラリティ(技術的特異点)と呼んで危機感を抱いて(あるいは瀆神的な期待を抱いて)いるのです。

東洋的な知の基盤に基づく人工知能はありえるか

 一方、東洋的な発想から人工知能を考えてみましょう。前提として、東洋から人工知能は生まれませんでした。これは、とても重要なことです。人工知能が西洋で盛り上がった1950年代の第一次ブームの頃、日本はそこにまったく関与していませんでした。まだ敗戦復興期にあたり時代的な難しさもありましたが、1980年代の第二次ブームになっても、人工知能に対する強い拒否感が、日本のアカデミズムにはありました。ダートマス会議から30年を経た1986年に日本の人工知能学会は立ち上がりました。その時でさえ、人工知能に強く反発する学者が多かったのです。
 「人工知能を構築する」というビジョンは、西洋発祥のものです。ここで歴史のifを想像してみるならば、西洋に人工知能が生まれず、あるいは生まれても東洋に伝えられることがなかったとすれば、東洋ではどのように人工知能が生まれえたのでしょうか。

 東洋では「在るもの」は最初から混沌としてあらねばなりません。そうすると、人工知能は、デジタル現象の中に見出されなければならないのです。つまり、メモリやプログラムが入り乱れる混沌の海の中から、ある日、人工知能が見出される、そういうシナリオが必要です。魚が海から揚がるように、人工知能は電脳の海から捕まえらえるものでなくてはならなかった。自然の中、デジタルの海の中で自然に形成されるものなくてはならなかった。もちろん、そのためには何十年、何百年かかるかわかりませんから、人工知能はまず西欧から出発せざるを得なかったのです。
 対して東洋の人工知能は、とても「生命」的なもの・「自然」的なものになるはずです。最初から全体でなければならず、それには知能と身体を伴った人工生命というビジョンの方が東洋には合っています。

▲構築される人工知能と、見出され掘り出される人工知能

 このような東洋的な人工知能は、たとえば『攻殻機動隊』(士郎正宗、講談社、1991-)では、「研究所から逃げ出した人工知能がネットの海で自己進化を遂げる」というイメージで描かれています。
 つまり東洋的な人工知能は、自己生成的なものであり、人間が支配するものではないのです。それは混沌を母体とした混沌の一部であり、西欧的な人間のサーバントではない。我々が理解しようとしまいと、すでにそこにあること自体が存在理由(レゾンデートル)なのです。

 また、台湾のIT推進大臣オードリー・タン氏は、イスラエルの歴史学者ユヴァル・ノア・ハラリ氏との対談の中で「コードはLawです。Lawといっても、法律ではなく、法則のようなものです」と述べています【※】。自然な「法則」と言うところに、はっきりとした東洋的な捉え方が現れています。西欧の立場ではあれば、社会は人工物ですから社会的な法律、と言ったことでしょう。数年前までは、これはネット社会に限定された議論でした。しかし、デジタルとリアルが重なる現代においては、いまや現実の社会全体に対する議論になりつつあります。

※AI新聞 -AI WEEKLY- 人工知能の世界をもっと身近に
ユヴァル・ノア・ハラリ、オードリー・タン対談「民主主義、社会の未来」全和訳

 極論すると、東洋は個については自然な存在として、さらに、全体についても世界に偏在するものとして人工知能を受容しようとします。西洋は、個としてはサーバントとして、全体としては人為的システムとして人工知能を受容しようとします。もちろん、グローバルな時代の現実において、それぞれの国家や社会は、この二つのどちらか一辺倒ではなく、それぞれの態度が混合した状態になっていると思われます。しかし、その混合比は、それぞれの社会の歴史や文化に応じた偏りをみせることになるでしょう。

 日本に関して言えば、人々の個としての自我の確立度合いが弱く、人工知能の主人として君臨するには適していません。そこで、やはり対等な関係や親しい友人の関係を望むのです。お掃除ロボットの主人よりは、名前をつけてペットとして扱う方が日本人には向いています。一方で、日本の世間は集団主義的な指向が強く、また、人間の力を超えた大自然の存在に対する感覚を鋭く持っています。自我の強い人工知能が社会を統治するよりも、自然環境のように潜在・偏在しながら社会を支える人工知能の方を受け入れることでしょう。
 つまり、社会全体に人工知能を導入されていくとしても、それは西欧のように社会契約に基づく厳密な議論をふまえた法律としてではなく、人々の協調を自然に促す法則のようなものであるかぎり、受け入れ可能になるだろう、ということです。

 一方で、同じ東洋でも中国におけるAIによる管理体制は、強い自我を持つ政府の延長上にあります。広大で複雑な社会のガバナンスを行うために、人工知能はますます研究・向上され、導入されていくでしょう。インターネットの扱いと同じように、現実世界においても強い管理体制をAIを通じて確立しようとします。
 これは一見、西洋型に近いタイプのように見えます。ところが、このような社会全体の受容としては、むしろ日本と同様に社会を裏から支える潜在的な法則のようなものとして受容されています。個としての議論の前に、全体の公共性が優先されているのです。また中国における人工知能は、非人格的な機能の導入に見えながらも、政府という主体の延長上にAIが行使されています。つまり政府という擬人化された存在の手足(エフェクター)として人工知能技術が行使されています。これもきわめて特徴的な点です。
 東洋におけるAIの導入には、やはりどこか人間の理解を超越した、良くも悪くも、世界に偏在する混沌に近づいていくようなアプローチが見受けられるように思います。

西洋的な「人工知能」と東洋的な「人工知性」を統合していくために

 つまるところ、従来の工学的な人工知能は、西洋の考え方の上に構築された人工知能です。すると、ゲームやエンターテインメントのAIが目指している一つの「生命」のような人工知能を実現するためには、人類の思考方法のもう一方の極である、東洋哲学的な基盤を取り入れる必要があるのではないか。それが、日本でゲームAI開発に携わってきた私が辿り着いた結論です。
 現代のようなグローバルな時代には、いまや学問的な知の多くは世界中で共有されており、東洋と西洋の対立などをあえて持ち出す必要は、通常の分野においてはないのかもしれません。しかし知能という混沌を捉えるためには多面的な視点が必要であり、このまま西洋の見ている夢だけに付き合い続けていると必ず壁に当たり行き詰まります。そこでは東洋的知見を思いきって西洋的なビジョンにぶつけてみる必要があると思うのです。

 東洋的な基盤から人工知能を構築する方法を展望するため、その代表的な思想である仏教における知能の捉え方を参照してみましょう。
 東洋は常に環境全体として知能を見据え、存在として世界に息づく知性全体を把握しようとします。そこから世界に立脚する存在の根を捉えようとします。唯識の思想では、目に見えているものを「相」と言います。たとえば、自分の顔、他人の顔などに見えているものが「相」です。しかし、その「相」を超えて真実の「性」(本性、性質)に至ること、これを「相を否定して性に至る」(遣相証性)と言います。では見えている世界は何かというと、ここに「識」があります。人間が見ている世界は、人間がさまざま欲求によって見せられている世界だとする考え方です。「識」には階層があります。「阿頼耶識(あらやしき)」は自分と対象を生成する根底の識であり、「末那識(まなしき)」は自分というものを見せている識です。そして意識や身体に密着した五識と連なり、いわゆる「八識」を構成します。

▲八識(横山紘一 「唯識の思想」、講談社学術文庫、P.60 )

 このような知能の内面に対する記述は、西洋の人工知能ではなされないことです。このような角度、このような知的性質について記述することがないからです。東洋はこのように知能の「本性」を探求します。それゆえに「知性」という言葉を当てるのが良いでしょう。この八識のような知能の存在の根幹に至る垂直構造の図というのは、西洋の人工知能には見られません。機能的なモジュールの関連図を描くのが西洋の人工知能です。つまり、東洋の哲学は、知能に関する存在論という領域をしっかり持っています。

 したがって私は、東洋的な思想基盤に基づく人工知能のあり方を、「人工知性」と呼ぶことにしたいと思います。自己の煩悩からの脱却を目指す仏教では、阿頼耶識、末那識を浄化することで、真眼を開くことが目的になるわけですが、人工知性を作ろうとするならば、むしろ人工知能に識を与える方法が必要です。
 現在の人工知能には、まるで「執着」というものがありません。人間でいえば解脱している状態に近い。識を与え、執着を与え、この世の人間のように執着する知能をもってこそ、人間らしい知能と言えます。
 八識は、そもそも深層心理における阿頼耶識において、偏った見方、偏った執着を施しておくことでそれを実現することを教えます。では阿頼耶識とは何かと言えば、世界をあるがままに受け入れる場所です。ここを濁らせていくことで偏見が生まれます。そして、その濁ったかたちで「ものが見える」ことになります。

 一方で、西洋の人工知能は存在論ではありません。機能論です。いかに、知的機能を実現するか、というところに重点を置くからこそ、知的機能、すなわち「知能」なのです。いわば、それは時間の流れの中で機能をつないで行く水平的展開です。たとえば、ロボティクスやゲームのキャラクターAIでは「エージェント・アーキテクチャ」というフレームを採用します。これは、環境と知能を明確に分け、知能をそれぞれのモジュールの連携として組み立てる、というデザインです。
 まず、「センサー」モジュールが世界から情報を獲得して蓄積します。そこから「認識」モジュールがその情報をもとに、「自分を中心とした世界のイメージ」を構築します。その「イメージ」をもとに「意思決定モジュール」が意思決定を行います。意思決定はイメージから論理的な結論を出したり、イメージ上でシミュレーションを行ったり(つまり想像)することで方針を決定します。最後に「行動生成モジュール」が意思決定の出した方針に従って身体の運動を形成します。そして身体や精神を動かすことで、身体運動や心的運動を実現します。高度な知能になればなるほど、この過程が階層的に積み重なっていきます。

▲エージェント・アーキテクチャ

 このように、西洋の人工知能が機能をモジュール(要素)の組み合わせによって探求している「水平型」の探求だとすれば、東洋は存在の根に向かう「垂直型」です。西洋の機能的知能観は、時間軸に沿ったアルゴリズムやモジュールの連携による知的機能の発現を見ますが、東洋の存在論的知性観は、知能の内部に幾重にも連なる複雑な空間を見るのです。つまり構造自体の中に知的性質を見出します。西洋の人工知能はより高度な知能の実現を目指しますが、東洋は人工知性の底に根源を見ようとします。

▲東洋の持つ人工知性の内的な空間と西洋の持つ人工知能の高度さ

 この両者の対立は、そのまま相互補完的な関係にあります。
 西洋が「何もない」とみなす場所に東洋は精緻な理論を組み上げており、また東洋が実践的な修行を通して人間の内面を探求していくのに対して、西洋は人間を対象化して探求することによって人工知能を生み出すに至りました。西洋は機械論的に知能を構築しようとするのに対して、東洋は混沌から知能を削り出そう、生み出そうとします。

 この二つの方向性は、今のところ交わっていません。しかし、この二つの対立を内包したところに、私たちが真にイメージする、あの一つの「生命」のような人工知能が生まれてくるのではないか。そのように私は考えています。
 そして彼らが私たちの隣人として立ち現れてきたとき、それは私たち自身の知能についての認識や倫理、そして都市や社会はどのように変わっていくのか、新著では現時点で可能なかぎりの考察を試みました。
 ご興味を感じていただけた方には、ぜひ手に取っていただければ幸いです。(了)

『人工知能が「生命」になるとき』購入はこちら

#不安 #開発 #解説 #インフラ #人工知能


実際のAIって、なんだか思っていたのと違う気がする……その違和感や不安はなぜ起こる?AI開発者・三宅陽一郎が解説