聴覚歪について                 最新改定 2025.Mar.30 JH3FJA

聴覚歪とは  歪が生じるメカニズム  耳の構造とはたらき  基底板による周波数弁別  外有毛細胞による再生増幅 
聴覚フィルタの概念  <振幅周波数特性>  <音圧依存性>  <マスク信号による聴感刺激>  <インパルス応答> 
<ガンマチャープフィルタの生成> 

聴覚歪とは
 人の聴覚は神経系が受け取っている信号でみれば必ずしも外来音が忠実に電気信号に変換・伝達されている訳ではなく耳の中の構造・動作による歪が含まれます。聴覚歪は人体側における音響的センシング機構での歪を指します。

歪が生じるメカニズム
 次のような簡潔な説明が Nature 2008年11月13日号 456, 7219 にありました。

聴覚 音の歪みが生じる仕組み
 哺乳類の耳、というより耳の聴覚にかかわる主要部である蝸牛は、感度が非常に高く、かつ精巧に調節された音・電気変換器である。また、蝸牛は音を著しく歪めるが、直観的な印象に反して、ヒトの耳に話を聞き取りやすくするマスキング効果を生じさせているのは、この音を歪める特性である。これまで、このような歪みがどこから生じるのかは不明だった。哺乳類の蝸牛には、内有毛細胞と外有毛細胞という2種類の有毛細胞があるが、Verpyたちはマウスを使った実験により、歪みを引き起こすのが外有毛細胞であることを明らかにした。 非線形性は、外有毛細胞の不動毛をつなぐ先端連結器、もっと専門的にいえば、ステレオシリンと呼ばれるタンパク質から生じるらしい。

耳の構造とはたらき
<内耳>

 空気振動である「音」は、外耳道(俗にいう耳の穴)を通り鼓膜を振動させます。 鼓膜の振動変位は耳小骨と総称されるツチ骨、キヌタ骨、アブミ骨からなるリンク機構により蝸牛(俗にいう うずまき管)の前庭窓(卵円窓)からそのリンパ液に向い振動を伝播させます。 鼓膜の面積に比べ前庭窓の面積は10分の1ほどですが結果的に鼓膜にかかる圧力が単位面積でみて20〜30倍に増幅され前庭窓断面に伝わります。 なお、ツチ骨とアブミ骨はおおきな動きを抑える筋肉を持ち大音響による過大な動きを抑えます。これは「中耳反射」と呼ばれる動作です。

 ツチ(槌):月のウサギが手に持っているあれ
 キヌタ(砧):皮や織った布等を槌で叩くときの台側の道具
 アブミ(鐙):騎乗時に鞍(くら)の両側に下げ足を乗せる馬具


<蝸牛>

 蝸牛は巻貝状の音響管で、断面で見ると上から順に 前庭階、蝸牛管(中央階ともいう)、鼓室階の3層構造になっています。
 前庭階は外リンパ液で満たされアブミ骨の振動はリンパ液の振動として螺旋を上に向い伝播します。


 螺旋の最上部(蝸牛頂)には穴(蝸牛孔)があり鼓室階へと繋がっています。鼓室階も前庭階と同じ外リンパ液で満たされ螺旋を下に向い伝播し最も下位置にある蝸牛窓で終わります。なお蝸牛窓は振動で外リンパ液が移動しやすくなっています。
 蝸牛管はカリウム濃度の高い内リンパ液で満たされ上記振動伝播の様子を写しとるかのように圧力分布が変化し、後述のコルチ器の巧妙な動作により神経信号へ変換され蝸牛聴神経線維を通じ大脳へと出力されます。

<蝸牛管>

 蝸牛内のリンパ液に伝わった振動(進行波の動き)は基底板を振動させ感覚上皮が振動刺激を神経信号に変換します。
 前庭階と蝸牛管を仕切る薄い膜はライスナー膜、蝸牛管と鼓室階を仕切る厚めの膜は基底板(あるいは基底膜)と呼ばれます。 基底板は螺旋の奥(頂部)に行くほど幅広く薄いので剛性は低く柔軟になっており、基部より頂部の方が曲げやすく、基部から頂部に向かうほどより低い固有振動数を持っています。
 この基底板による周波数弁別については後で詳述します。

<コルチ器>

 基底板の蝸牛管側にはコルチ器と呼ばれる器官が整然と並んでいます。 コルチ器の上部には内有毛細胞と外有毛細胞が蝸牛管に沿って1列および3列並んでおり、その数は片耳で内有毛細胞が 3,500 ほど、外有毛細胞が 15,000〜20,000 ほどあり、いずれも細胞頂部に固い毛の束 聴毛(ちょうもう)を持っています。更に聴毛に屋根のように被さる蓋膜(がいまく)が聴毛の先端に接する形であり、基底板の振動により有毛細胞を刺激します。


 これは蓋膜を外し聴毛群を眺めた電子顕微鏡写真です。左の1列(ジュリアナ扇子みたく)が内有毛細胞の聴毛、基底板の振動による聴毛での刺激が源となり神経パルスをつくります。
 右の3列(基本「く」の字形の配列)が外有毛細胞の聴毛群、外有毛細胞自身の運動によって「蝸牛増幅器」とも呼ばれる機械的な重畳動作による基底板の振動増幅を行います。これにより高い感度と選択特性を得ています。

 外有毛細胞も内有毛細胞と同じく聴毛のずれによって膜電位を変化させますが、それを信号として神経系に伝えるのではなく運動細胞として外有毛細胞自身の長さ(上の図では高さ)を変化させます。 これは細胞膜にある電位依存性のあるタンパク質モーターによるもので、外有毛細胞のみに存在するプレスチン(細胞の側壁膜に存在する膜タンパク質、化学的エネルギーを機械的エネルギーに変換)と呼ばれるタンパク質の作用と考えられています。 外有毛細胞はこれにより最大20KHz以上もの高い周波数で細胞自身で振動助長ができ、人体内のあらゆる運動細胞より はるかに高速な動作をしています。有毛細胞が実際に基底膜を伝わる進行波をもとに これらの動きをしていることは1991年に初めて実験的に確認がなされ、これにより非線型的な諸特性の説明モデルが提起されました。

基底板による周波数弁別

<フォン・ベケシの進行波モデル>
 蝸牛管の基底板での周波数弁別機能のシンプルなモデルはピアノののように周波数順に並んだ弦それぞれが入力に応じ共振し神経へと情報を伝えるとするもので、19世紀にはヘルムホルツが基底膜を固有振動数の異なる繊維の束で表現したモデルを提唱しましたが、後に1960年になって生物物理学者フォン・ベケシ によって流体力学的相互作用を加味した基底膜を伝わる進行波としたモデルで置き換えられました。 あぶみ骨から蝸牛の基部の液体(リンパ液)に伝えられた純音の振動は流体の流れを作り出し基底膜を揺らしながら頂部へ向って波として伝わる。 この振動は周波数に応じたある距離までしか到達しない。入力が高い音なら振動はわずかの距離しか伝わらず、低い音なら先端の方まで振動がおよぶ。 この限界の距離位置の少し手前で基底膜の振幅は最も大きくなり、異なる音の高さの純音はそれぞれ基底膜の蝸牛管に沿った異なる位置で振動パターンを作り出す。現在はこの進行波モデルが一般的です。

<粘弾性体の振動固有値>
 粘弾性体とは、弾性体であるゴムのような伸び縮みする性質と 油のような流動性を兼ね備えた性質を持つ材料のことです。例えばスライム、寒天やゼリー、を想像すると分かり易いです。基底板上に現れる振動挙動の基本原理はこの粘弾性体膜における高次振動挙動そのもので、金沢大学での分かりよい実験結果を掲げます。


 固定枠は剛性の高い塩ビ材によるもので供試体膜をこの面に張り付けます。振動入力は固定枠全体を加振し供試体面全体を振らせます。供試体膜表面での振動変位はレーザ変位計にて2次元計測されます。


 供試シリコンゴム膜の寸法形状・材料物性に沿った有限要素法解析(シミュレーション)と強制振動入力による実験計測結果です。なお点列を成す振動固有値は右台形長辺側から左台形短辺側に順に周波数・固有値次数が増えています。


 これは保持枠寸法、供試シリコンゴム膜寸法が上とは違いますが有限要素法解析(シミュレーション)で基本から40次までの高次固有値振幅最大位置が求められたものです。

<実態的な特性>
 下の2つの図は、Human information processing,Lindsay Norman,Academic Press 1977 にある人体計測等で得られた実態的な特性です。左図では、蝸牛の螺旋2回と3/4回転を引き伸ばし直線状と見做し、2段目のテーパ管の絵では内部の基底板のテーパ型を表現、更に基底板上位置と呼応した振幅が最大となる周波数をピアノ鍵盤イメージとともに表現されています。 また、右図では単音に対する基底板長手方向の振幅特性(位置対相対振幅)を示しています。横軸スパンの35mmは、左図での伸長した蝸牛螺旋の長さにあたります。
外有毛細胞による再生増幅

<トーマス・ゴールドの仮説>
 1948年、トーマス・ゴールドは「蝸牛が再生回路のように動作している」という仮説を発表しました。リンパ液に満たされた蝸牛の内部ではその粘性による損失のため受動的な共振だけでは十分な選択度が得られないことは当時すでにわかっていました。この頃 無線の世界では選択度と感度を上げるための手段として再生回路は広く知られており、同じ目的のために自然界でも同様の仕組みに違いないとゴールドは推測、しかし この仮説は他の研究者に受け入れられず忘れ去られました。30年後の1978年、デヴィッド・ケンプは人が音を聞いた直後や無音状態の時に耳から小さな音が発生する現象を発表しました。ケンプの健常者を対象にしたこの現象は耳音響放射と名付けられ蝸牛が単純な受動的なものではないことを示しました。これが転機となり、それまで十分には理解されていなかった外有毛細胞の役割など蝸牛に関する多くの研究が行われ、ゴールドの仮説の正しさが認められるようになりました。

<再生増幅の概念>

 これは基底板に現れる複数の固有値並びをLC共振回路で、外有毛細胞の側壁の伸び縮みによる振動の増大を信号増幅回路と電磁的結合によるその帰還(正の重ね合わせ:再生)として表現した機能回路です。 簡単にするために扱う固有値は3つ、その振幅出力は、reso1、reso2、reso3 です。再生の度合に影響するアンプ回路部のゲインを3種類変化させ帯域特性を得るようにしてあります。

 振幅出力reso1(黄緑線)、振幅出力reso2(青線)、振幅出力reso3(赤線)が各振動固有値の帯域特性です。それぞれの色での重ね描きの山は、ピーク値0dBのものが積極的な再生のない基準状態、順に再生を強めた状態、一番ピークレベルの高いものが基準の10倍程の強い再生を掛けた状態です。再生により、振幅出力の増大(内有毛細胞からの神経出力感度の増大)、帯域特性の狭域化による選択度の向上が図れることがわかります。

聴覚フィルタの概念
 「聴覚フィルタ」とは簡単に言ってしまうと上述でそのメカニズムを説明した「蝸牛」の入出力特性をモデル化したものです。基底膜上に位置した中心周波数と帯域幅の異なるバンドパスフィルタが周波数順に連続的に並んで存在すると見做せるので「聴覚フィルタ」、あるいは群を成した状態を扱い「聴覚フィルタバンク」と呼ばれます。が、その特性の定式化は人体相手に採れる計測手法が限られていることもあり未だ過渡期にあります。ここでは最新の「ガンマチャープフィルタ」によるフィッティングを中心に説明します。
 幸い日本音響学会誌2010年66巻10号に掲載された"はじめての聴覚フィルタ (やさしい解説)"に その特性が分かり易く説明され、Pythonによるプログラミング記述で学べるようにしたPython版ガンマチャープフィルタ(元の記事ではMATLAB/Octave版学習ツール)も公開されています。オープンに利用できるJupyter Notebook上で実行でき ブラウザ上でGoogle Colabへのリンクの操作だけで使える学習ツールになっています。以下はこれによるアウトプットグラフを用い関連説明を行うスタイルにしています。
 Pythonで学ぶはじめての聴覚フィルタ
 demo_gammachirp_notebook

<振幅周波数特性>
振幅周波数特性グラフ
 これは入力の音圧レベルが一定の場合です。横軸は周波数、縦軸はフィルタの利得です。横軸は周波数の値の並びを見ても感じるように線形軸ではなく対数間隔に近い軸(等価矩形帯域幅 (equivalent rectangular bandwidth; ERB) という聴覚的なスケール)となっています。これにより6つ(飽くまで例)の中心周波数を持つフィルタが周波数に関わらず同じような形状を持つこと、周波数方向でみて非対称なスロープであることが見てとれます。
 なお、ここでの中心周波数と帯域幅の間には次の関係があることが実験計測から知られています。
   ERBN=24.7(4.37F/1000+1)
 ERBN:健聴者の測定から得られた矩形等価帯域幅(Hz)
 F:フィルタの中心周波数(Hz)


<音圧依存性>
音圧依存性グラフ1
 これは入力の音圧レベルを変化させた場合です。横軸は周波数(Hz)、縦軸はフィルタの利得です。色が同じピーク周波数、線種(実線,破線,細破線)が同じ条件の入力音圧レベルになっています。
  実線:50dB(基準)入力
  破線:70dB 入力
  細破線:90dB 入力

 入力音圧の変化によって聴覚フィルタの周波数応答も変化していることがわかります。

音圧依存性グラフ2
 同様に入力音圧レベルを変化させた場合の周波数応答で、入力音圧レベル30dBから90dBまで60dBの増大変化を与えています。入力音圧が増大するとともにフィルタゲインは減少し、フィルタの帯域幅も広域化(ゲインの最大値が大きく下がっているのに周辺でのゲインはさほど下がっていない)しています。

音圧依存性グラフ3
 上の条件での変化を入力音圧レベル対出力レベルで描いたグラフです。破線表現のリニアな特性と比較すると、30dB辺りの低い音圧レベルではゲインが30dB以上増加しているのに対し、90dB辺りでは利得がほとんど無いことがわかります。聴覚フィルタは小さい音ほどゲインを増大させ、大きい音ほどゲインを減少させる圧縮特性を持つことがわかります。
 聴覚心理分野でも電気回路分野と同様に圧縮特性(compression) と呼ばれます。


<マスク信号による聴感刺激>
マスク信号による聴感刺激1
 1KHz正弦波1波の音圧入力に対する聴感刺激の周波数特性です。このような基本的な特性は帯域雑音(マスカー音)として純音(プローブ音)と同時に再生し、雑音のマスクキング閾値を求める等で色々な特性計測に有効です。

マスク信号による聴感刺激2
 200Hz から 2000Hz まで 200Hz 間隔で10波の複合音圧入力に対する聴覚刺激の周波数特性です。複合させる元信号を選ぶことでの任意の帯域雑音(マスカー音)を得ることができます。


<インパルス応答>
インパルス応答
 インパルス音圧入力に対する時間応答特性です。
 上がガンマチャープフィルタ、包絡線がガンマ関数、搬送波周波数変化するチャープ波であるためガンマチャープと呼ばれています。
 下が参考用にガンマトーンフィルタ、包絡線がガンマ関数、搬送波が正弦波(ピュアトーン)であるためガンマトーンと呼ばれています。

<ガンマチャープフィルタの生成>
ガンマチャープフィルタの生成
 以上の説明で対象とした入力音圧依存性のあるガンマチャープフィルタの生成について少し説明します。

 ガンマチャープフィルタ (cGC) は、音圧依存しないパッシブガンマチャープフィルタ (pGC) と 圧縮特性を持つハイパス非対称関数 (HP-AF) を使い生成されています。  左図において、pGC(黒線表現) と HP-AF(入力レベル各色の破線表現)の2つを従属接続することで、レベル依存性を持つ圧縮型ガンマチャープフィルタ (cGC)を得ています。 最大レベルは最大音圧レベル (デフォルトは70 dB) でのフィルタのピーク レベルによって正規化されています。

非対称性比較
 ガンマチャープフィルタ と ガンマトーンフィルタ の振幅周波数特性の非対称性の比較です。ガンマチャープフィルタでは非対称性までもが扱えます。



改定来歴:  2025.Mar.30 作成