本人の声でリアルタイム翻訳・再生する音声技術「BabelOn」

 サンフランシスコのスタートアップBabelOnが、人の声をリアルタイム翻訳し、本人の声質のまま音声合成する技術を発表しました。たとえば、洋画を見る際にこの技術を使えば、俳優本人の声のまま、日本語吹き替えされたバージョンが鑑賞できます。



 BabelOnはこの音声変換技術はソフトウェアと専用ハードウェアで成り立っており、入力された音声を声質から分析、即座に異なる言語に変換して再生可能だと説明しています。よく似た技術としては最近利用可能になったSkypeのリアルタイム翻訳機能があるものの、Skypeの場合は翻訳後に再生される音声がぎこちない音声合成なのに対して、BabelOnでは話している本人の声そのままに聞こえるよう、声質までを再現するところが大きな違いです。




 この音声合成の部分は基本的にはボーカロイドなどと同様、あらかじめその人の声を一定量サンプリングしたプロファイル情報BLIP(BabelOn Language Information Profile)を作成します。BLIPでは声だけでなく胸郭、喉、口の動きやブレスまでを分析して、音声合成特有の発音のぎこちなさをなくし、感情表現まで本当に本人が喋っているように音声化できるとのこと。

 ただ、懸念されるのはこの音声合成技術を一般にまで広げて提供してしまうと、だれかがBLIPを盗み出せばたちどころに「完璧なオレオレ詐欺」が可能になってしまう可能性があること。また大統領クラスの人のプロファイルを作れば、サイバーテロリストがそれを盗み出し、電話での首脳会談に割り込んで勝手に宣戦布告したりすることも可能になりかねません。

 このためBabelOnはBLIPの保管のために高度に暗号化したオフラインの保管サーバーを用意し、使用する際は声の持ち主の要請に基づいて審査を実施する、またBabelOnで合成した音声にはそれが変更された日時を確認できる仕組みを導入すると説明しています。

 話が物々しくなりますが、多くの言語トラックを作らなければならない映画業界人の目には、BabelOnの技術はかなり魅力的に映ることは間違いありません。ゲーム製作会社も然り。さらには世界的な音楽アーティストを抱えるレーベルにとっても、アーティストがファンの国の言語で直接話しかけるプロモーションビデオを作ったり、ライブのMCで活用したりすることもできるかもしれません。

 BabelOnは現在、Indiegogoでこの音声技術を実用化させるための出資を募集しています。どう考えても業界向けの技術への出資を、なぜ一般を対象に募集しているのかは定かではありませんが、今回のクラウドファンディングで得た資金は必要なソフトウェア・ライセンスの取得のために用いたいとのこと。一方でキャンペーンを通じてBabelOnの技術を広く世界にアピールするという目的もあるようです。

 なお、BabelOnが対応を予定する言語は英語、フランス語、スペイン語、ドイツ語、ポルトガル語、北京語、ヒンディー語、そして日本語。もし、BabelOnが実用化されて誰でも気軽に使えるようになれば、吹替版「コマンドー」を英語圏の人が楽しむ...というシチュエーションもあり得るかもしれません。

(Engadgetより)

スポンサーサイト
コメント
コメントの投稿
管理者にだけ表示を許可する