SmartVoice(Ver4.0)の音声合成機能とサンプル音声 SmartVoice(Ver4.0)の音声合成機能とサンプル音声 音声合成とは、与えられたテキストデータを、音声データに変換する機能です。例えば、「こんにちは」というテキストを与えると、それを「こんにちは」という音声に変換します。 SmartVoice(Ver4.0)では、文章の読み上げを行うために「NEC音声合成エンジン4.5」を搭載しています。この音声合成エンジンを使用することで、 SmartVoice Editorや市販アプリケーションソフトなどに入力された文章を読み上げさせることができます。※1 SmartVoice(Ver4.0)の音声合成エンジンには、以下のような特徴があります。
では、SmartVoice(Ver4.0)の読み上げ音声を聞いてみましょう。
サンプル音声の内容:
NECからSmartVoice(Ver4.0)が発売されました。
認識率が向上し、声の登録なしでも使えます。
また、読み上げ音質が向上し、ワープロソフトや表計算ソフト上の文章の読み上げも可能です。
読み上げサンプル ttssample.wav (192KB)
また、SmartVoice(Ver4.0)の音声合成エンジンには、ハイブリッド音声合成という機能が搭載されています。 例えば、パソコンから何らかのメッセージを音声合成で出力するとき、「メールがX件届いています。」「○番にジャンプします。」のように、メッセージの一部が可変で、他の部分が定型というメッセージがよくあります。 SmartVoiceではこのようなメッセージを出力するときに「ハイブリッド音声合成」という機能を使っています。 上記の例では、「メールが」「届いています。」は定型で、「X件」の部分が件数により変化します。このようなメッセージを出力するときに、「メールが」「届いています。」の部分はあらかじめ録音した音声データを利用し、「X件」はテキストから音声合成を行ない、両者を繋ぎ合わせて出力するのがハイブリッド音声合成という機能です。 ハイブリッド音声合成のイメージは下図のようになります。
ハイブリッド音声合成により、定型部分の音声が録音音声に近くなり、ハイブリッド音声合成を使わない読み上げよりも自然に近い音質で読み上げます。※2 では、ハイブリッド音声合成のサンプルを聞いてみましょう。
サンプル音声の文面:
今月のプロバイダ料金は950円、電話料金は900円です。
(上記の文例では、下線部が可変部分となっています。)
(下側にある比較用の音声は、ハイブリッド合成の音質を確認するために同じ文章をハイブリッド機能を使わずに読み上げさせた音声です。)
ハイブリッド音声合成サンプル ttshybrid.wav (63KB) (比較用の非ハイブリッド音声合成サンプル ttsnohybrid.wav (69KB))
このハイブリッド音声合成は、SmartVoice(Ver4.0)では、例えば以下のような場面で使用されています。
|