音声の個人性の生成要因

1. 声道の形の個人差

顔が人それぞれ違うように、声も十人十色です。 私たちは、声の特徴(音声の個人性)が声道(声の通りみち)の どの場所から生まれるのかについて研究しています。 これがわかれば、人の声の違いまで再現する発話ロボットや 音声合成システムを作れるようになります。 音声を使って個人を特定する話者認証技術の信頼性も向上するでしょう。

研究ではMRI(磁気共鳴画像法)を用いて 声道の形の個人差を観測しています。 そして、この違いが音声にどのような影響を与えるのかを調べています。

MRIでとった画像の例をご覧にいれます。 これらは「い」と発声しているときの4人分の画像です。 みな同じく「い」と言っているのですが声道の形はずいぶん違います。 この形の違いが音声の個人性を生む1つの要因です。 声道の形がこんなに違うのに、全て「い」に聞こえるのは本当に不思議です。

sbject1_i sbject2_i sbject3_i sbject4_i

2. 声道の下部構造

音声の個人性は、音声の中で「話す内容による変化が小さく」かつ 「人によって違う」成分であると考えることができます。 この考えにもとづいて、声道で「話す内容による変化が小さく」かつ 「人によって違う」部分を探したところ、 声道下部がこの条件を満たすことがわかりました。

下に一例を挙げます。5母音(「あ」「え」「い」「お」「う」)を 発声したときの声道の形(横断面形状)を取り出したものを並べたものです。 声門から30 mm 程度までの声道の形は、 母音が違ってもあまり変わらないことがわかります。

cross
5母音を発声した時の声道の横断面形状。図の上が体の前方向。

さらに検討したところ、 この部分(声道下部)の形は人によって異なることがわかりました。 従って、この部分が個人性を生み出している場所の1つである可能性があります。 また、この部分の個人差は音声の約2.5 kHz以上の周波数の個人差となって 現れることがわかりました。

3. 鼻腔の影響 (2013〜)

声は口からだけでなく鼻からも出ています。 鼻をつまんで声を出すといつもと全然違う声が出ることから、鼻音以外でも鼻が影響していることがわかります。 鼻から出る音は鼻腔の形に大きく影響されます。 鼻腔はたいへん複雑な形をしている上、人によって形が大きく違います。 昔から、鼻音が話者の認識に有効であることが知られていましたが、鼻腔の音響的影響については詳しく知られていませんでした. 私たちは2013年からこれについて研究を始めています。

この研究は科学研究費補助金の支援により行われました.


Last updated on Mar. 22 2015.
copyright © 2015 Tatsuya Kitamura / All rights reserved.