AI時代で少数言語が消滅!? 「言葉」を守るデジタル社会の在り方とは 

ロボティア編集部2019年9月4日(水曜日)

検索エンジンや機械翻訳、音声認識など、人工知能の領域のひとつである「自然言語処理技術」が、ここ数年めざましい発展を遂げている。機械翻訳ソフトや家庭用AIスピーカーなど、GAFAを中心としたIT企業群のサービスおよびプロダクトの精度向上の実例を挙げていけば枚挙に暇がない。

今年2月には、日本でも三菱電機が独自技術を用いた「シームレス音声認識技術」を発表した。これは、スマートフォンやカーナビに搭載されるシステムだが、登録されている言語であれば話者が言語設定をわざわざ切り替えたりする必要がない。また、複数の言語で同時に話しかけても認識する、つまり「言語の障壁がない=シームレス」な音声認識技術だという。

それら自然言語処理技術の発展動向を俯瞰する限り、機械の言語認識能力向上の流れはとどまることがさそうだ。画像認識技術のように、精度やエラー率において人間の能力を凌駕する日が訪れるのかもしれない。もしかしたら、多くの人間が同時かつ多言語で話しかけても聞き分ける、聖徳太子のようなAIシステムがいずれ登場する可能性もある。ただ一方で、「AI×言語」、もしくは「デジタル×言語」という領域には、いくつかの課題もある。その最たるもののひとつが、少数言語への対応である。

数年前、欧州の60の研究センターを統合する学術団体メタネット」(META-NET)の共同プロジェクトが、興味深い発表を行った。自動翻訳、音声コミュニケーション、テキスト分析、利用可能な言語資源といった観点から、欧州の30の言語についてデジタル上の言語技術サポート状況を検証した結果、アイスランド語、ラトヴィア語、リトアニア語、マルタ語、ブルガリア語、ギリシャ語、ハンガリー語、ポーランド語など、21の言語が、デジタル時代に消滅の危機にあると評価・指摘したのだ。

話者の少ない少数言語は、ビジネス的な観点からするとどうしても後回し、もしくは無視されがちだ。例えば、「AIスピーカーの認識率が向上した」という各報道があるが、「英語など主要言語に対するAIスピーカーの認識率が向上した」という方がより正確であろう。多くの少数言語は、そもそも認識技術の対象とさえされていない。メタネットの発表は、そのようなデジタル上の言語サポート状況の格差や、テクノロジーの発展に取り残されていく言語の存在に警鐘を鳴らすものであり、現在もその状況は大きく好転していない。

「少数言語を含むデジタル時代における各言語のあり方については、議論が深められる必要がある」

そう指摘するのは、東京外国語大学アジア・アフリカ言語文化研究所の中山俊秀教授。ワカシュ諸言語(北米北西海岸地域の言語)などを研究する、少数言語問題の専門家である。

東京外国語大学・中山俊秀教授

「経済的なコストや効率性を考えると、そもそも人間の言語はひとつのほうが社会にとって都合が良いと思われるかもしれません。使う言語がみな同じであれば、コミュニケーションの齟齬や誤解も減るかもしれない。例えば、カナダでは英語とフランス語が公用語で、すべてが二言語表示。商品の説明書なども倍の厚さになる。一見、とても非効率ですよね。紙ももったいない(笑)。インターネットが普及し、各個人に多くの人々との接点が日々生まれているデジタル社会にあっては、言語の多様さはなおさら非効率なものと捉われてしまいがちです。しかし、さまざまな言語が存在し続けることは、人間社会にとって非常に価値が高いことでもあるのです」

特定の社会集団には、挨拶、ユーモア、食事の作法やお金の払い方などなど、共通した生活習慣があるが、言語もそのような「ふるまい方のひとつ」。同じ意味を持つ外国語や他言語に翻訳したとしても、決して伝えきれない“エクストラな価値”が各言語に内在していると中山氏は強調する。例えば、英語には、「お疲れ様」や「恐縮です」などの日本語をそのまま表現できる言葉がない。同様に、各言語にはその言葉を使うことでしか伝わらない、いたわりや喜び、怒り、悲しみなどさまざまな感情が含まれる。その各言語の微細なニュアンスは、それぞれの集団内に固有の価値を生んでいるのだという。

「また世界の各地域や社会によって、関心を持つ対象やその対象を表す言葉の数やバラエティーが異なります。例えば、日本だと米を表す言葉が豊か。一方、砂漠の人々は砂の色やラクダの状態を説明する言葉が豊富です。イヌイットなら雪、モンゴルなら馬の毛並、南米の先住民なら薬草と、それぞれ多様な形態や種類を区別する語彙がたくさんある。それらは、マクロな視点で見た際、人類が築き上げた多様性であると同時に知的な財産なのです。それが消滅していくということは、個人レベルでは社会との接点や選択肢、多面性を失うこと。人類全体としては知が失われていくことを意味します」