Infoseek 楽天

AIが短い動画とテキストデータから長尺の講義動画を生成! 「gacco」にて公開

Techable 2021年3月13日 13時0分

株式会社データグリッドとNTTテクノクロス株式会社および株式会社ドコモgacco(ガッコ)は、2021年3月12日に大規模公開オンライン講座「gacco」にて、「AIを活用したMOOC講座」を開講した。

この講座では、テキストデータから生成した音声データと、数分程度の講師の講義動画から生成された人物動画を組みあわせて、まるで講師が話しているかのような長尺の講義動画を配信する。

講義動画の生成フロー

配信される講義動画の生成方法は2段階。

まず、NTTテクノクロスの音声合成サービス「FutureVoice Crayon」に講義のテキストデータをインプットし、人間の声と遜色ない自然な音声データを生成する。

次に、データグリッドのAIによる人物動画生成技術を活用し、数分程度の講師動画をもとに人物動画を生成。動画内の人物の口の動きを先程の音声にあわせることで、まるで講師本人が話しているような長尺の講義動画を自動的に生成できるということだ。なお、この技術は、少数のデータで精度の高いデータ生成が可能なGAN(Generative Adversarial Network)により実現している。

AIの基礎から学べる

現在、こうして生成した講義動画を「AIの基礎と開発プロジェクトの進め方」という講座名で「gacco」にて公開中。同講座は、3週間にわたり実施される予定だ。

第1週では、AIの概要と最低限押さえておきたい専門用語の解説などAIの基礎についてレクチャーする。第2週では、AIのなかでも比較的新しい領域である「生成AI」について、具体的な応用事例も交えながらその仕組みを解説していく。第3週では、AI開発プロジェクトを進めるうえ需要なポイントを、フェーズごとにまとめて公開するとのことだ。なお、講師を務めるのは、データグリッドの代表取締役社長 CEO 岡田侑貴氏。

このたびの「AIを活用したMOOC講座」は、国内初だという(2021年3月12日現在、ガッコ調べ)。この技術が浸透すれば、講義動画のみならず、膨大な資料を読み上げるような動画作成において、大幅なリソース・コストカットが実現するのではないだろうか。

PR TIMES

この記事の関連ニュース