1.音声の明瞭度について


人間の音声(会話や歌)が明瞭に聞こえる、という要件は非常に重要であります。

では、明瞭さはどう評価すべきでありましょうか?

自分のオツムでは、いきなり難しいことを考えても得るところは少なそうですので、
ここでは還元論的に、周波数特性に焦点を当てて、参考になるソースをピックアップ。


ソース 内容(大雑把な抜粋、もしくは俺解釈)
「音響振動工学/コロナ社」 P.36〜37

図 2.20「日本語についての明りょう度指数貢献度D およびそ
の周波数積分値Afc(三浦)」
・音声の明瞭度に寄与するのは 250Hz〜7,000Hz

・中でも重要なのは 250Hz〜3,400Hz
「電気音響振動学/コロナ社」 P.28〜37

図 2.24 「基本周波数が異なる同じ母音(fatherのa)スペクトルの比較」

図 2.25 「"Joe took father's shoe bench out"と話したときのソナグラム(Fletcher)」

図 2.29 「任意の周波数より下の成分を除いた場合(HP)、あるいは上の成分を除いた場合(LP)の明瞭度(Fletcher)」
・音声を音楽に使う場合の基本周波数は85Hz(男声)〜1,100Hz(女性)程度の範囲。
母音については、おおよそ250Hz〜2,500Hzの範囲にスペクトルが広がっている。 (ピークは750Hz前後)
子音については、おおよそ2,500Hz〜7,000Hzの範囲に特徴的なスペクトルが広がっている。
・HPの場合、1,000Hz以上を通過させれば、明瞭度は約90%を保てる。
・LPの場合、3,000Hz以下を通過させれば、明瞭度は約90%を保てる。
・よって、1,000Hz〜3,000Hzの範囲を通過させれば、明瞭度を約90%に保つことが出来る。
・低い周波数を切り捨ててもさほど明瞭度には影響しないが、高い周波数を切り捨てると子音の明瞭度は著しく低下する。
その他参考URL

(1)
慶應義塾大学2005年度秋学期「授業名:人間環境整合論 」(第7回講義) 2.12.4 明瞭度に寄与する周波数
http://gc.sfc.keio.ac.jp/class/2005_14630/slides/07/39.html

(2)
リアルタイムアナライザ(RA)・サウンドアナライザ(SA)の測定事例 「日本語音声の分析1」〜「日本語音声の分析7」
http://www.ymec.com/hp/signal/voice1.htm


俺まとめ

・音声の再生が自然に聞こえるためには、「250Hz〜7,000Hz」の範囲の周波数特性の凹凸の少なさに注目すべし。

・中でも音声の再生に最も重要な周波数の範囲は 「250Hz〜3,400Hz」。
この範囲で極端な音圧の低下があったり、大きな音圧の山谷がある機種は、音声の再生に何らかの不自然さがありそうだ、と言えましょう。

・子音の特徴は「2,500Hz〜7,000Hz」に表れている。
よって、「サ行のきつさ」を判定するには「2,500Hz〜7,000Hz」の音圧に注目すると良いかも。



・・・と書いてみると、意外にフツーな結果ですけど、
ポイントは「それなりに周波数が明確に指示されている点」でありましょう。



=======================

しかしながら・・・

「そんなこと言われてもな・・・試聴じゃあ周波数特性なんか分かんないから無意味じゃん?」

という指摘は、全くごもっともであります。


「使えない」のであれば薀蓄の価値は殆どなし!
(知識欲は満足出来るかもしれませぬが)



・・・・・どうしよう。



えーと。
こんな案はどうでしょう。

DAPにスイープ信号のwavファイルを入れておきまして、
試聴機で再生して、耳で甚だしい凹凸が無いかチェック。(うわ無理やり)



人間の耳の周波数感度は複雑な曲線で(※)個人差も大きいので、
細かなところは当然無理ですが、甚だしい凹凸についてはもしかしたら見つけられるかも。

(※)このグラフでは下に行くほど感度が高いことになります。
スピーカーや普通のオーバーヘッドタイプのヘッドホンなら
同じ音圧なら3〜4kHz近辺は音が大きく聞こえるのが自然、という塩梅。)


ということで、こんなファイルを作って実際に試してみました。

【注意】機器や耳への影響から、いずれも音量は-20dBと低めにしています。
もし試される場合は、最初は音量を低めにしておいて、再生しながら少しずつ音量を上げて調整してみてください。
ファイルの概要 WAVファイル

いずれのファイルも
44.1kHz/16bitサンプリングのwavファイル。
@レベル調整用
1kHz基準信号
1kHz(-20dB)10sec 1_1khz10sec.wav
A20Hz〜1kHzスイープ 20Hz〜1kHz(-20dB)10secリニアスイープ

※1秒おきにクリック音入り。
最初のクリック音=おおよそ100Hz
2回目のクリック音=おおよそ200Hz
・・以下同様。
2_20hzTo1khz10secsweep_click.wav
B20Hz〜10kHzスイープ 20Hz〜10kHz(-20dB)10secリニアスイープ

※1秒おきにクリック音入り。
最初のクリック音=おおよそ1kHz
2回目のクリック音=おおよそ2kHz
・・以下同様。
3_20hzTo10khz10secsweep_click.wav


【ダメ人間な例】
自分で数機種やってみた結果、
(メモを取りながら5〜6回再生)


(1)ER-4S
20〜1kHz:緩やかに単調増加。
20〜10kHz:2クリック目と3クリック目の間でやや目立つピーク感。他は大きな凹凸感なし。

(2)10Pro
20〜1kHz:1〜2クリック目で僅かに増加。以降一旦降下後1kHzまで単調増加に転じる。
20〜10kHz:1〜4クリック間全体として少し凹感、5〜6クリック目で若干凸、7〜8クリック目は凹感、以降10まで単調増加。

(3)Westone3
20〜1kHz:2〜3クリック近辺が緩やかだが大きめのピーク感。
20〜10kHz:2〜3クリック間にやや目立つ凹み、4クリック目に少しピーク感。5〜6クリック間にやや目立つ凹み、以降単調増加。

(4)ATH-CK100
20〜1kHz:かなり小さな音から始まり単調増加。
20〜10kHz:4〜5クリック目に2段階の大きな凹み。7〜8クリック目から単調増加。




ER-4Sと、ATH-CK100割りと単純な周波数応答なので、特徴がかなり分かりやすかったですが、
他の2機種はちょっと複雑で難しかったかも。

とはいえメモを取りながら数回も再生すれば、大まかな傾向は掴めるのではないかと思います。


ちなみに、実際にやってみると
測定結果ではかなり激しい起伏も、意外にそれほど明確には分からないことや(あ。自分の場合は、ですよ。念のため)、
左右のドライバーの個体差も良くわかって、結構面白いのではないかと思ったりします。



トップへ
トップへ
戻る
戻る