121ware 閉じる


NEC







SmartVoiceの読み上げ音声を聞いてみよう

SmartVoice(Ver4.0)の音声合成機能とサンプル音声

ハイブリッド音声合成とサンプル音声


SmartVoice(Ver4.0)の音声合成機能とサンプル音声

音声合成とは、与えられたテキストデータを、音声データに変換する機能です。例えば、「こんにちは」というテキストを与えると、それを「こんにちは」という音声に変換します。

SmartVoice(Ver4.0)では、文章の読み上げを行うために「NEC音声合成エンジン4.5」を搭載しています。この音声合成エンジンを使用することで、 SmartVoice Editorや市販アプリケーションソフトなどに入力された文章を読み上げさせることができます。※1

SmartVoice(Ver4.0)の音声合成エンジンには、以下のような特徴があります。

  • 従来のNEC音声合成エンジンよりも読み上げ音質を向上させ、読み上げが聞きやすくなっています。※2

  • 読み上げ辞書が約20万語に強化されています。

では、SmartVoice(Ver4.0)の読み上げ音声を聞いてみましょう。

サンプル音声の内容:

 NECからSmartVoice(Ver4.0)が発売されました。

 認識率が向上し、声の登録なしでも使えます。

 また、読み上げ音質が向上し、ワープロソフトや表計算ソフト上の文章の読み上げも可能です。

読み上げサンプル ttssample.wav (192KB)

 


ハイブリッド音声合成とサンプル音声

また、SmartVoice(Ver4.0)の音声合成エンジンには、ハイブリッド音声合成という機能が搭載されています。

例えば、パソコンから何らかのメッセージを音声合成で出力するとき、「メールがX件届いています。」「○番にジャンプします。」のように、メッセージの一部が可変で、他の部分が定型というメッセージがよくあります。

SmartVoiceではこのようなメッセージを出力するときに「ハイブリッド音声合成」という機能を使っています。

上記の例では、「メールが」「届いています。」は定型で、「X件」の部分が件数により変化します。このようなメッセージを出力するときに、「メールが」「届いています。」の部分はあらかじめ録音した音声データを利用し、「X件」はテキストから音声合成を行ない、両者を繋ぎ合わせて出力するのがハイブリッド音声合成という機能です。

ハイブリッド音声合成のイメージは下図のようになります。

ハイブリッド音声合成により、定型部分の音声が録音音声に近くなり、ハイブリッド音声合成を使わない読み上げよりも自然に近い音質で読み上げます。※2

では、ハイブリッド音声合成のサンプルを聞いてみましょう。

サンプル音声の文面:

 今月のプロバイダ料金は950円、電話料金は900円です。

 (上記の文例では、下線部が可変部分となっています。)

(下側にある比較用の音声は、ハイブリッド合成の音質を確認するために同じ文章をハイブリッド機能を使わずに読み上げさせた音声です。)

ハイブリッド音声合成サンプル ttshybrid.wav (63KB)

比較用の非ハイブリッド音声合成サンプル ttsnohybrid.wav (69KB)

 

このハイブリッド音声合成は、SmartVoice(Ver4.0)では、例えば以下のような場面で使用されています。

  • SmartVoiceAssistantにて、「○○さん、こんにちは。何をしますか?」と音声出力。

  • インターネットの料金確認で、「今月のプロバイダ料金は○○円、電話料金は○○円です。」と応答。(i版のみ)

  • 「みんなでメール」でメールを1件受信したときに、「○○さんからメールが届いています。」と応答。(i版のみ)


※1 アプリケーションソフトによっては読み上げられない場合があります。
※2 読み上げ音質の比較に関する記載は、弊社での評価結果によるものです。
※3 音声データはWaveファイル形式でアップロードしています。実際の音声合成エンジンからの出力は16Bit, 22kHz, モノラルのPCM形式ですが、本ページではダウンロード時間を短縮するため、ADPCM形式に圧縮して掲載しています。


NEC Copyright(C) NEC Corporation, NEC Personal Products,Ltd.