なんでもマルチメディア(424):音声合成技術

ある企業の研究所で見学した最新の研究成果の一つに、パソコン画面に表示されている文書を読み上げる音声合成技術のデモンストレーションがありました。このデモンストレーションでは、小説の一文を読んでいましたが、イントネーションや間合いの取り方がプロのナレーターにかなり近いという印象でした。
 音声合成の研究の歴史は長く、すでに多くの設備や機器に、合成音による音声ガイド機能が組み込まれています。しかし大部分は、比較的短い定型的な文節を組み合わせるものであり、小説のような任意の文章を、感情を込めて表現できるレベルには達していません。
 文章を読む機械がどのようなところで有用かというと、目が不自由な人や病人を想定することが多いようですが、その利用範囲はかなり広いはずです。ラジオの番組に小説の朗読があります。自分で選んだ小説の朗読に目をつぶって聞き入ることができれば、多くの人たち、特に病人や高齢者は大喜びするでしょう。外国の新聞・雑誌を日本語に自動翻訳して読み上げるのを聞き流せるようになれば、現役のビジネスマンにも利用が広がると思います。通勤電車のなかで小説を読んでいる人が沢山います。揺れ動く混んだ車内で本を読むのはかなり疲れますが、機械が読み上げる声を耳で聞くならば、疲れも少なく、快適な時間を持てるはずです。
 聞く人が違和感をもたないような自然な音声を、携帯機器で合成できるようになるまでに何年かかるか分かりませんが、この分野の研究がもっと活発になることを期待しています。音声合成の究極の目標は何かと考えると、いろいろなアイデアが浮かびます。聴きたい歌や自分で歌いたい歌の楽譜をパソコン画面に表示して、自分の声に合わせて機械に歌わせることができれば、新たな楽しい時間が生まれることと思います。
都丸敬介(2005.09.18)

スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です