Infoseek 楽天

音声は出版の新しいフロンティア──文字以上の可能性を秘めている

ニューズウィーク日本版 2019年4月4日 17時45分

<AI「音声エージェント」によって、音声は出版の新しいフロンティアとなった>

出版にとって「デジタルの衝撃」が何であったかは、米国でも立ち位置によって、見え方は大きく異なる。しかし、出版市場における最大のサプライズは、誰が見ても「オーディオブック」だろう。これが一つのフォーマットという以上の存在となると考えた人は少ないと思われる。

読書における「モード」

録音・再生技術で音声読書をサポートする商品は、1世紀以上前から存在し、カセットテープやCD-ROMを媒体として一定の存在ではあり続けたものの、それはつねに紙の本の影の存在で、目が使えない時のものだった。専用のツールを必要とし、もちろん安くはなかった。それ以上に大きいのは、「視覚読書能力」をデフォルトとして個人や社会が形成されてしまったことだ。聴覚のほうは職業的にアンバランスな場合が多く「無用」という人もいる。

しかし、デジタル時代はメディアによってモード(状態)を遷移することができる。デジタルとモバイルWebは、読書におけるモードを自在に移行可能にした。それまで「読書」にはモードがなく、活字が配布される以前は耳から伝えられ、暗記・復唱は言語能力の基本だった。

活字は「耳の集中」から人々を解放したが、代わりに「黙読」や「速読」という別のノルマを課した。近代以降は、教えられたとおりの「視覚読書」を叩き込まれている。漢字文化圏の多くの人、とくに音韻が単純な日本語でこれをマスターするのは容易ではなく、眼鏡は当たり前、ストレスを感じないほどに専門文献を読める人は「学者」と呼ばれるほどだ。

今では、ほぼすべて標準的なAIが活字を「読める」ようになった。コンピュータはモードに対応するが、人間や社会はOSを切換えられないので、モードレスのまま一世代は経過する。オーディオブックは、米国でも40代以下の若い世代に多く普及している。とくに目を休めてコンテンツに集中したいということだろう。若い世代がモードを自然に切替えるようになると、出版ビジネスは「活字離れ」を心配する必要がなくなる。そのぶんストレスが減るということだ。

聴覚の歴史は文字より長い

人類のコミュニケーションにおいて、声は目(文字)より数十万年は長い歴史を持っている。言語表現はここで生まれ、成長した。文字の普及が人口の1割を超えたのが、せいぜい150年、四世代を超えたとは思われない。

「視覚読書」は膨大な教育コストを払って実現されているのだが、近代という国家的努力で推進されてきたメリットを出版業界は享受してきた。長い目で考えると「視覚/聴覚」の「併用/切替」がデフォルトとなり、それに応じて無用なストレスを減らすことが教育コミュニケーションのテーマとなると思われる。アマゾン(Alexa/Echo)は、音声インタフェースがショッピングにおけるデフォルトであることを宣言したが、この会社が「ストレスフリー」であることの意味は大きい。



「標準化」された文字言語は、安定したものではあるが、言語作品にとってそれが価値であるかどうかは一概に言えないだろう。英国の英語教育では、シェイクスピア戯曲の400年前の活字版口語を子供に読ませているという。英語の変化が比較的に少ないということもあるが、これは音声言語を継承する一つの考え方だ。文字と音声の関係は、生きたものであるほどよいように思われる。

音声言語が初めて記録・再生されるようになったのは1世紀半ほど前だが、ほとんど商業メディア(出版と放送)の中に閉じており、身近な生活に入ってきたのは、モバイルWebが初めてということになる。ひと世代くらいで、まだ社会は社会的空間での音声表現の利用に慣れていない。「オーディオブック」は文字作品の影として生まれたが、さらに大きな可能性があると考えたほうが自然だろう。これまで出版における音声は、補助から主役へと発展している。

アクセシビリティ/音声代替(読書補助)
エクスペリエンス/パフォーマンス(音声表現/体験)

前者は「テキスト」という文字による枠があるが、後者は自由であり「テキスト」との関係は自由に設定が可能で、音声をオリジナルとすることも可能だ。表現の自由な展開を可能するという意味で、詩人や詩を愛する人に歓迎されるだろう。活字出版は「版の経済性」に拘束されたビジネスであり、表現の多様性(ゆれ)は価値ではないが、デジタル・コンテンツでは価値ともなりうる(これは「版」と「バージョン」の違いでもある)。クラシック音楽では、曲によって数種類もの「印刷譜」がある場合があり、演奏家に選択が任される。印刷譜と音楽の間には距離があり、その空白部分の解釈/表現という音楽体験に価値があるためである。

デジタルが「出版」を解放した

耳になじんだことばは、韻文として詩に伝わり、また言語の生命力は、口語(口頭言語)の変化として言語をリードしている。音声言語は文字言語と表裏の関係にある。朗読や朗唱はヨーロッパやアジアでも重要なライブ・パフォーマンスの伝統とされている。活字出版以降の黙読の普及は、音声言語と音読を表舞台からは消し去り、エジソンの発明になる蓄音器や、その後のカセットテープが細々と「音声出版」をつないでデジタルの時代を迎えたが、Webの登場がもたらしたものは、ストリーミング・メディアによる朗読というだけではなかった。

ラジオ(ポッドキャスト)
音声パフォーマンス、
音声/文字変換、
音声インタフェースである。

これらは、音声コンテンツを再生できるだけでなく、それを販売することもできる。Webは「放送」も「ライブ」もいや「それ以上」のことも出来たからだ。

20世紀の終わりに、ついに音声は文字との垣根を乗り越えた。デジタルが活字を扱えるようになって間もなく、音声は文字に、文字は音声に変換が可能になり、その効率と精度は、時間とともに着実に向上した。目も眩むような高解像度グラフィックの、音声が重要なインタフェース言語でもあることに注目した人はあまりいなかったが、これも重要な変化だった。

20年後に、AIの進化で面目を一新した「音声エージェント」で、われわれは人類最古の「出版」がいまでは強力で豊かななテクノロジーに支えられていることを知った。音声は出版の新しいフロンティアであり、文字以上の付加価値を秘めている。

※EBook2.0 Magazineからの転載です。

Web時代のブックビジネス─本/著者/読者に何が始まったか: Kindle以後10年Book II-1


鎌田博樹(EBook2.0 Magazine)

この記事の関連ニュース