オープンな音声データベースを対象にした話者間知覚距離の計測

1. 目的

音声の個人性知覚に関する従来の研究では,それぞれの研究者が自前の音声データを用いて研究をしていました.そのため,実験結果が各自の音声データに依存している可能性が否定できませんでした.また,研究者が結果を相互に検証することも困難でした.そこで,私たちは高度言語情報融合フォーラム(ALAGIN)より公開されている,ATR音声データベースセットC中の話者を対象にして話者間知覚距離を計測し結果を公開することにしました.話者間知覚距離とは,私たちが複数の話者の声を聞いて似ていると感じる程度のことです.

2. 実験条件

3. 実験結果

5段階評定に以下の数字を割り当て,実験参加者間で平均したデータを公開しています. データが必要な方は北村宛 (t-kitamu_AT_konan-u.ac.jp) にご一報ください. 男性話者20名,女性話者20名を対象としたデータがあります.

  1. 似ていない
  2. あまり似ていない
  3. やや似ている
  4. 似ている
  5. 同一人物

このデータを非計量MDSで分析し,2次元に布置した結果を以下に示します(左:男性, 右:女性).図中の番号は下の表に対応します.

male mds female mds


speaker list

さらに,同じ実験を別の被験者群で行い,結果に再現性があることを確認しました.(2014年度)

4. 対外発表

詳しくは以下の資料をご覧ください.

この研究は科学研究費補助金の支援により行われました.


Last updated on Mar. 21 2015.
copyright © 2013-2015 Tatsuya Kitamura / All rights reserved.