初音ミクを生んだ“革命的”技術を徹底解剖!ミクミクダンス、音声、作曲…

Business Journal / 2013年1月16日 7時5分

 このようなメディアは、別段目新しいものではありません。アニメや映画も、つまるところ上記の定義で説明できます。

 しかしこの説明では、単なる映画にすぎない初音ミクに対して、なぜ「愛しているよー」と絶叫する、興奮した聴衆が存在するのか? をうまく説明できません。

 そこで、このテーゼに対して、技術面からのアプローチと、心理面からのアプローチを試みます。

●初音ミクを支える技術

 まず、初音ミクをつくり出す技術について説明させていただきます。

<第一の技術:歌唱音声技術>

 歌唱音声技術とは、初音ミクに歌ってもらう技術です。この段階では、初音ミクの独唱(ソロ)をつくることになります。初音ミクが踊っている姿も、楽曲の演奏も生成されません。

 特許庁の検索エンジンで、「ヤマハ」「音声」で検索をかけたら、ボーカロイド技術に関する発明は5つありました。注目すべきは、「特許公開2002ー202790 歌唱合成装置」であり、これこそが、現在の初音ミクを成立させる技術と考えられます(2008年1月に日本国の特許権が成立済み)。

 初音ミクの歌唱は、コンピュータがつくる声ではなく。現実の人間の声を使って生成されています。具体的には、生の人間の音声をバラバラにパーツ化して、データベース化してあらかじめ保存しておきます。そして、初音ミクに歌わせる時に、それらのパーツを素材として使って、再構成することで「歌」をつくり出すのです。この発明は、それらのパーツを連結する時に発生する「不自然さ」や「ノイズ」を除去するという技術に特徴があります。

 この技術は、現実の人間の音声を「絵の具セット」のようなものとして保存しておき、歌唱をつくる時に、パレットの中でそれらの色を混ぜて、無数の色をつくり出せるようにして、カンバスの上に自由に絵を描けるようにしたもの、という理解でよいと思います。

 初音ミクの「声の絵の具」は、藤田咲という声優さんによって提供されています。しかし、その「声の絵の具」の種類が半端ではありません。なんと500種類(英語だと2500種類)もあるのだそうです。

 その「声の絵の具」の収集は、相当大変なものだったと推測されます。「あ、い、う、え、お」というような単純な単音の録音では足りず、二音素連鎖というものも必要になるからです。例えば、一般の人は、子音の次に母音がくるような音を発音できません。「た」は「tーa」ですよね。では、それを逆にした「aーt」という音をイメージできますか?「あーた」(「aーtーa」)ではありません。「aーt」です。今では、三音素連鎖という音まで収録して保存しているのだそうです。音声を提供された藤田咲さんの苦労は、かなり大変だった推測されます。

この記事に関連するニュース

トピックスRSS

ランキング