2.人にやさしいゆっくり通話技術〜電話機への応用〜
                                      三洋電機株式会社
1.はじめに

 2000年末で60歳以上の高齢者が総人口に占める割合は23%以上あり、今後も高齢化が加速することが予想されています。そのため、高齢者が快適な社会生活をおくれるようにする技術・機器の開発は重要になってきています。周知のとおり高齢者の聴覚劣化の特徴は、周波数特性が劣化するだけでなく、時間特性も劣化し、早口の音声を聞き取りにくくなります。
 高齢者にとって最も身近な情報の入手手段の一つとして電話機があります。電話機では上記の問題が顕著にあらわれることが予想され、相手の声が早口で内容が聞き取り難いと感じる人が高齢者を中心に約6割あり(当社調べ)、不便を感じているようです。
 そこで当社では、音声をゆっくりとした聞き取りやすい速度にリアルタイムに変換する「ゆっくり通話技術」を開発し、電話機に応用しました。

2.ゆっくり通話技術の特長
(1)声の高さが変わらず自然な音声
 早口の音声を単純に引き伸ばしてゆっくりにすると、テープレコーダの回転数を通常よりも遅くした再生音と同じで、声の高さが低くて間延びした音声になってしまいます。本技術では、声の高さを変えずに音声波形を伸長処理することにより、自然でゆっくりとした聞き取り易い音声に変換することができます。

(2)遅延を最小限に抑える
 音声を一様にゆっくりと変換すると、原音声に対して次第にズレ(遅延)ていきます。図1のaは通常の音声(原音声)を表し、これを一様にゆっくりに変換した場合bのように大きな遅延が発生してしまいます。本技術では、以下の手法により、遅延を最小限に抑えています。

 1 原音声から音のある有音部分と、音のない無音部分を検出し、有音部分のみを伸長処理し、無音部分は違和感を損なわない程度に削除します。
 2 原音声に対する再生音声の遅延を常に監視し、適応的に伸長処理の伸長率を制御します。


3.電話機への応用
 電話機には側音という現象があり、送話器から入力された話者の声が電話機本体の回路を通して受話器に回り込み、エコーとして話者に聞こえてきます。ゆっくり通話技術を電話機に応用した場合、ゆっくりになった自分の声がエコーとして聞こえるため、非常に話しづらくなるという課題がありました。それに対しては、ゆっくり通話向けエコーキャンセラ技術を開発することにより、エコーを除去し、快適な会話を実現することができました(図2、写真1参照)。



       写真 ゆっくり通話技術搭載電話機


4.ゆっくり通話技術の有効性を確認
 ゆっくり通話技術により変換した音声を50歳代から80歳代の男女55人(平均年齢68.4歳)の被験者に提示し、聞き取りやすさを評価しました。
 約10モーラ(*1)/秒の早口の原音声を伸長率0.9倍から0.6倍で伸長(9から6モーラ/秒のゆっくりに変換)した際の評価結果を図3に示します。横軸は音声の速さを表し、縦軸は聞き取りやすさを表しています。ゆっくりに変換するにつれて、聞き取り易くなっていることがわかり、本技術の有効性を確認することができました。
 また、年齢が高くなるにつれ、聞き取りやすいと感じる音声の速度は遅くなる傾向があることも分かりました。


5.おわりに
 今回開発したゆっくり通話技術では、音声をゆっくりとした聞き取りやすい速度に変換し、それに伴う遅延を最小限に抑えていますので、自然でわかりやすい会話を実現することができます。
 さらに、電話機に応用することにより、自然な会話の中で、相手の早口の声を聞き取りやすくすることができ、快適な会話を実現することができました。
 また、高齢者を対象に評価を行った結果、ゆっくり通話技術の有効性も確認しました。
今後は、電話機以外への応用も検討したいと考えております。

(*1)モーラ:1モーラは、短母音を含む1音節の長さに相当する。日本語では、ほぼかな1字がこれに相当する。


著者:井上健生(いのうえたけお)
   三洋電機(株)ハイパーメディア研究所
   ヒューマンインタフェース研究部
   E-mail:inoue@hr.hm.rd.sanyo.co.jp
   TEL:072-841-1169FAX:072-841-1413

 NMDA-Topページへ 研究成果Indexへ 研究成果目次へ