特集 : 言葉と文化と生成AIと - ことば研究館

PDFで見る

クロストーク特集言葉と文化と生成AIと

窪田悠介
国立国語研究所研究系准教授

荒瀬由紀
東京科学大学情報理工学院教授

古田徹也
東京大学大学院人文社会系研究科准教授

言語学、哲学、工学。
異なる学問分野の専門家3人が「言葉」とそれを取り巻く問題について語り合います。

窪田：古田さんのご著書^※には「魂ある言語」と「魂なき言語」という表現が出てきます。私は言語の形式理論、古田さんの言葉で言うところの「魂なき言語」が専門なのですが、今日はクロストーク、つまり異分野格闘技なので、お二人とあえて「魂ある言語」の方についてお話ししてみたいと思っています。
^※『言葉の魂の哲学』古田徹也著、講談社選書メチエ、2018年

荒瀬：私の専門は、自然言語処理です。言語データを工学的に処理し、人間と遜色ないレベルで言語を理解し生成する技術の実現を目指して研究をしています。魂のない手法で「魂ある言語」を処理しようとしている、と言えるかもしれませんね。

古田：「魂」というのは、20世紀前半の哲学者ルートウィヒ・ウィトゲンシュタインが書き記した一節から取っています。彼は、「言葉というものには魂があるのであって、単に意味があるだけではない」と述べています。例えば、彼がそこで実際のところ何を言わんとしているのかを明らかにする、といったことが私の研究の幹になっています。

大規模言語モデルの光と影

窪田：膨大な言語データを学習して文章を生成する大規模言語モデル（Large Language Models：LLM）が開発され、それを活用したChatGPTのような生成AIサービスが多くの人に使われています。コツコツと言語資源を整備してきた国語研のわれわれとしては、そうした急激な動きを面白いと思いつつも戸惑いを感じています。荒瀬さんは「LLMの光と影」というタイトルで講演をなさっていますが、光と影とはどのようなことでしょうか？

荒瀬：これまでの自然言語処理では、流暢りゅうちょうな文章を生成することそのものが課題でした。LLMの登場によってこの課題は解決し、ぱっと見では人間が書いたのか、言語モデルが生成したのか分からない状況になりました。そのおかげで、工学的努力を、意味を理解する、文章にどういった内容を持たせるかといった、より言語の本質に迫る技術に充てられるようになり、LLMを応用したさまざまな便利な技術がどんどん登場してきました。これがLLMの光の側面です。
　一方で、LLMが生成する文があまりに流暢で自然なために、人間がLLMとの会話に依存してしまう問題が指摘されています。海外では、ドラマのキャラクターを再現するLLMとの会話に入り込み、その影響で自殺するということも起きています。依存性は、これまでの言語モデルでは考えられなかった問題であり、LLMの顕著な影の一つです。

古田：LLMは驚くべき技術であり、ある種の疑問や恐怖を感じる人も多いようです。果たして、私たち人間は言葉を理解しているが、LLMは理解していない、というふうに言えるのか。人間がやっていることとLLMがやっていることには、実際のところ違いはないのではないか、という疑問ですね。しかし実は、「流暢に言葉を使って受け答えすることができていれば、言葉を理解していると本当に言えるのだろうか」というのが、ウィトゲンシュタインの追求し続けた問いでした。彼は一般的には、「言葉の意味とは、その使われ方である」という、いわゆる〈意味の使用説〉の提唱者として知られていますが、彼の関心は、本当はその先にあります。今、LLMを多くの人が体験するようになり、彼の問いの核心をずいぶんと理解してもらいやすくなった。問いをかなり共有しやすくなった。ウィトゲンシュタイン研究者としては、このことがまずありがたいし、面白いですね。

窪田：古田さんは、ウィトゲンシュタインに影響を与えたカール・クラウスという哲学者が、20世紀初頭、紋切り型の言説への大衆の依存に警鐘を鳴らしていたことをご著書で書かれていますよね。人間ってそもそも、そういう人工的なもの、見かけだけ自然なものに依存しやすいのではないでしょうか。

古田：依存性で思い出したのが、20年以上前に発売されたAIBOというペットロボットです。それを本物のペットのように扱い、壊れて修理ができなくなると心底悲しんで、お葬式まで行う人もいました。人間は確かに依存しやすい一面があるというか、思いのほかすんなりと信じやすい一面があるのだと思います。断片的な振る舞いとか言葉だけであっても、そこに犬らしさや人間の心といったものを感じ、すっと受け入れてしまう。ひいては、依存してしまう……。特にLLMの場合、画面に現れる文章のやりとりだけで依存する人がたくさん出てきているわけですから、これは、人間というものの特性に関して重要なことを物語っていると思います。

言語モデルは「魂ある言語」を話すか？

窪田：荒瀬さんは、「いい感じのホテルありませんか？」という人間のいい加減な問いに、いい感じに聞き返しながらホテル選びを手伝ってくれるような言語モデルが欲しい、という話をされていますよね。そこまでくると、もうほとんど人間と同じなのではないかとも思うのですが、LLMは、心を持つようになる、つまり、「魂ある言語」を話すようになるのでしょうか。

荒瀬：私はかなり工学的な人間で、乱暴に言うとLLMが工学的に役立つのであればそれでよいと考えている節があります。外から見て心を持っているように振る舞うのなら、それは心を持ち、「魂ある言語」を話していると思ってもよいのではないでしょうか。ウィトゲンシュタインには怒られるかもしれませんが、ある意味で人間も似たようなものではないかな、と思うことがあります。

古田：何を実現しようとしているのか、何を理解しようとしているのかで変わってくると思います。ウィトゲンシュタインが「言葉の魂」と言うとき、主に考えていたのは詩についてです。私たちが心を打たれる、腑に落ちる、思わず噴き出して笑ってしまうような言葉を、言語モデルが生成することは当然できると思います。しかし、その言葉を生成するときに、言語モデル自身が心を打たれる、あるいは「驚く」ということはないでしょう。逆に、人間にはそのように「驚く」ことがある。このことが、「言葉の意味」とか「意味を理解する」ということにとって極めて重要な要素だと私は思うのです。しかも、心を打たれる、腑に落ちる、思わず噴き出すといったことは、文化的背景や経験によって異なる場合がよくありますし、人間同士の場合、そうした経験の共有がしばしば必要になります。

荒瀬：個人的な背景の影響は大いにありそうです。言語モデルの個別化はこれからの研究開発の方向性として意識しています。と言いつつも、私が想定していたのは、その人に合ったニーズを満たす、あくまでも「ツール」であって、詩に心を打たれることや、経験の共有といったことは、想像もしていませんでした。

人間の言葉が変わっていく？

荒瀬：現在の言語モデルは、同調しやすい傾向があると言われています。学習する言語データに否定で返すものが少ないことが原因の一つのようです。確かに、人間はあまり相手の話を聞いてくれませんが、言語モデルは話を遮ることなく最後まで聞き、同調した応答をしてくれます。

古田：言語モデルが同調しやすいというのは、救いになる面もあるとは思います。人間同士のやりとりの場合、流暢に話すことへのプレッシャーが強く、遠慮してぎこちなくなってしまうということがあります。一方、言語モデルはうまく話せなくてもずっと待ってくれますし、ずっと話し相手になってくれます。途中で話を遮ったり無視したりすることもないため、話し相手として使って、話しながら考えを整理したりできます。ただし、先ほども出ていたように、私たちは簡単に依存してしまう傾向があるので、そこに対処するための仕組みも必要でしょう。

荒瀬：言語モデルと会話することに慣れることで、人間の言語が影響を受けることも考えられます。LLM以前に機械翻訳でも同様の事例がありました。機械翻訳にそのままの日本語の文章を入れても思ったような翻訳にならない。そこで、省略を補完して翻訳させて結果を見てまた元の文を直し再翻訳、といったことを繰り返すと、満足のいく結果を得られるようになります。LLMでもプロンプトと呼ばれる指示を文章で与えますが、初めはなかなか意思疎通がうまくいきません。しかし繰り返すうちに指示の出し方がだんだんうまくなり、意図した応答が得られるようになっていきます。つまり言語モデルに忖度そんたくして、人間の言葉の方がゆがんでいく可能性もあります。そして、それを言語モデルが学習することでさらに変容が進みます。

古田：私もよく機械翻訳を使いますが、ブラッシュアップをしていく過程で、だんだんと誤解の余地が少なく、構文が明快で、多義性を持たない、つまり「やさしい」言葉に寄せていく感じになっていきます。

窪田：そこ、個人的にはすごくもやもやします。文系の分野だと論文を書くときなどに、レトリックの切れ味で勝負するみたいな面が良くも悪くも存在します。だけど、皆がLLMを道具として使うようになると、そのうち言葉にレトリックなんて要らない、といったふうに人間の言語自体が変わっていくんじゃないか、みたいに思ったりすることがあって。

古田：その可能性はすでに現実化している部分もあります。私自身はけっこう危機感を抱いていますね。複雑性、多義性、曖昧あいまい性をそぎ落としていった言語には、メリットとデメリットがあると思います。

荒瀬：言語から感じる情緒や味はなくなりますよね。

古田：言葉を発することは、物事のある側面、相貌そうぼうを照らし出すことだと思うのです。しかも、それぞれの言語に、特有の相貌を照らし出す語彙がたくさんある。それがとても面白いし、われわれの発想の源泉にもなっているはずです。そういう豊かさや多様性が失われてしまうとすると、それは大きな損失だと思います。

話された言葉と書かれた言葉

窪田：文字というものについて、どうお考えですか？　私は「文字は言語においては副次的なものである」といった野蛮なことを平気で言う研究伝統に属している人間なのですが。

古田：古代ギリシアまでさかのぼると、当然文字はすでに使われていて、書物として残せる環境はありましたが、当時の哲学者の中には、ソクラテスのように、絶対に書物は残さないという方針を取っている人が何人もいました。彼にとっては、広場で誰かに語りかけて問答する、その相手とのやりとりが自分の活動の全てでした。それに対して弟子のプラトンはたくさんの書物を残していますが、ただ、師匠を見ているので、文字に対する強い不信や疑問もありました。実際彼は、その場で誰か特定の人に対して熟慮をもって発せられる言葉こそが最も重要なものであり、他方、文字は警戒すべきものであるということを、矛盾しているようにも思えますが、まさに文字で書き記しているわけです。

窪田：例えば、この鼎談で私がちょっと不用意な発言をしたとするじゃないですか。先ほどの「野蛮なことを平気で言う研究伝統」みたいな。そういうものが、この場から切り離され、発言だけが取り上げられてしまうと、確かに怖いですね。「窪田は、理論言語学は野蛮な学問だと言った」みたいに。ですが、文字が発明されて記録できるようになって以来、私たち人間はもうそこから逃げられないのかもしれません。

古田：それがまさしくプラトンが危惧していたことです。人々が文字や書物に頼って記憶をいわば外部化するようになると、本当はものを知らないのに知っているかのようにうぬぼれるようになる、とか。それから、文字はそれが書かれた文脈を離れて独り歩きしてしまうから、誤解が誤解を呼んだり思わぬ影響を与えてしまいがちだ、ということを彼は指摘しています。

荒瀬：なるほど。古代ギリシアの時代から、発言がツイートのように意図しない形で拡散されることに対する危惧が表明されていたのですね。

古田：ただ、そこには良い面、面白さもあります。言葉が独り歩きすることで意図しなかったアイデアが喚起されたり、伝言ゲームのように、いわば「不正確」に変わっていくことも、言葉の本質的な魅力だと思います。言葉は、その場で発せられてやりとりされるものと、文字など記録されるものという両面性を持つのだと思います。

言葉を巡る問題は連続している

窪田：多方面にわたる話題について刺激的なお話を伺うことができました。最後にお二人から一言ずつお願いします。

荒瀬：生成AIの登場によって浮かび上がってきている依存性や言葉の変容といった問題は、少しずつ形や見え方は違うけれども、ソクラテスの時代から続いていて、本質的には変わらないということが、とても興味深かったです。そして当然ながら言葉は「文字列」ではなく深淵なものだということも改めて理解できました。

古田：言葉を巡る問題の本質は、ずっと変わらずに存在しています。肝心なのは、それがまさに言葉の特徴だということであって、その特徴とどう向き合うかだと思います。だから少なくとも、言葉を巡る問題が技術や規制で解決できるという幻想を抱くべきではないでしょう。そうではなく、良くも悪くも言葉というものが持つ諸特徴を、改めて丁寧に見返すことが必要なのかもしれません。

窪田：私としては、今回の鼎談は、ちょっと分野的に距離がある人たちと手探りしながら話していた感覚が新鮮でした。3人で今日ここに集まったことが、今後の異分野間の対話が活発になっていくことの一つのきっかけになるとうれしいなと思っています。