人工内耳の信号処理(Cochlear Implant Signal Processing / Coding Strategies)
⚠️ 医療者向け研究レビュー。診療判断・医学的助言ではない。最終判断は一次資料と専門家の評価による。 最終更新: 2026-06-03 / 反映論文: 9件(うち全文精読4件・abstract-only暫定5件) / 未レビュー
サマリ(現時点の到達点)
人工内耳(CI)の信号処理(符号化戦略, coding strategy)は、マイクで捉えた音響信号を電極-神経インターフェース上の電気パルスへ変換する一連のアルゴリズム(前処理・帯域分割・包絡線抽出・電気信号生成)を指す。基本パイプラインは、入力音を有限個(機種により12〜22)の周波数チャネルに分割し、各チャネルの包絡線(envelope)を電気パルスに変換、蝸牛の周波数局在(tonotopy)に対応する電極へ送るものである。従来の主要戦略(CIS、ACE)は主に時間包絡線(おおむね2〜50 Hzの緩やかな振幅変動)を抽出・伝送し、これは音素同定・静寂下の基本的音声認識に十分だが、スペクトル分解能と時間微細構造(temporal fine structure; TFS)は良好に伝送されない。この限界がピッチ・音色・声の韻律・音楽知覚の劣化と雑音下聴取困難を生む。改善アプローチとして、スペクトル強調(電流ステアリング=仮想チャネル)、TFS符号化(FSP系)、個別化マッピング、電気触覚刺激(EHS)、バイモーダル/電気音響刺激、新規符号化(InterlACE)などが研究されている。
カバレッジ(この知識の確からしさ範囲)
- 背骨(anchor): — 歌唱・音楽知覚を軸にCI信号処理の限界と改善戦略を統合したナラティブレビュー・2025(Brain Sci)。全文精読済。SR/メタ解析ではない(SANRA観点で網羅性は非保証)が、符号化の機序・戦略名・周波数帯・チャネル相互作用を具体的に記述。
- 全文精読(full-text)済: (信号処理の基本・限界・改善)、(電気触覚刺激EHS)、(ラウドネスモデルと客観的フィッティング)。
- abstract-only暫定: (CCi-MOBILE研究プラットフォーム・全文未取得)、(旋律輪郭同定MCI・F0符号化比較)、(新規符号化InterlACE)。加えて前巡の俯瞰レビュー・AI応用・上行聴覚路(いずれもprovisional-abstract)。全文入手で要再評価・昇格。
- 飽和目標: 符号化戦略を系統的に比較するSR/メタ解析・大規模RCT(CIS vs ACE vs FSP等の戦略間比較、音楽知覚・雑音下聴取の改善)と、改善戦略(EHS・電流ステアリング・新規符号化)の確証的RCTを次回優先で取得し、定量的エビデンスを補強する。
病態・基礎(信号処理パイプラインと限界)
- パイプライン: マイク入力 → 帯域分割(バンドパスフィルタバンク、機種により12〜22チャネル)→ 各チャネルの包絡線抽出 → 蝸牛周波数局在に対応する電極への電流パルス生成。ラウドネスは電気刺激パラメータ(パルスレート・電流レベル・電極数)に依存し、現象論的モデル(時間積分窓・電極相互作用・specific loudness変換)で説明される。
- 符号化戦略:
- CIS(Continuous Interleaved Sampling)/ ACE(Advanced Combination Encoder): 主に時間包絡線を抽出・伝送する従来主流。包絡線手がかりは音素同定・静寂下音声認識に有効。ACEは各時刻でエネルギーの大きいチャネル(マキシマ)を選択するn-of-m型。
- FSP(Fine Structure Processing)/ FS4 / FS4-p(MED-EL): 中〜高域チャネルは包絡線型(CIS様)、最尖端3〜4チャネル(低域)はフィルタ波形のゼロ交差にパルスを同期させTFSを明示的に符号化。FS4-pは尖端の並列刺激でTFS表現を強化。
- スペクトル分解能の限界: 電極チャネル数の少なさ、場所-ピッチ不一致(place-pitch mismatch)、広いバンドパスフィルタ、電流の広がり→チャネル相互作用(channel interaction)=隣接電極の重複興奮=スペクトルの滲み(spectral smearing)。電極相互作用は蝸牛レベルのラウドネスモデルにも組み込まれる。
- TFSの限界: TFS(おおむね600〜10000 Hzの波形微細変動、位相・タイミングを符号化)は良好に伝送されず、細かいピッチ知覚・雑音下音声理解・音源分離に不可欠な手がかりが失われる。
- 帰結: ピッチ/旋律知覚不良(小さなピッチ変化の弁別困難)、音色弁別困難、声の韻律(prosody)・感情認識の障害、雑音下聴取困難、音源定位困難、音楽享受の大幅低下。歌唱では聴覚-運動フィードバックループが破綻し、約6半音規模の粗い誤差にしか反応しなくなる。
診断
- 本トピックは信号処理アルゴリズム(基礎・デバイス)が主であり、診断的位置づけは中心ではない。臨床的適応・診断は 人工内耳 を参照。
治療・応用(改善アプローチ)
- スペクトル情報の強調: 電流ステアリング(current steering)で隣接2電極へ同時通電し物理電極間に「仮想チャネル(virtual channel)」を作り、弁別可能なピッチ知覚を増やす。Advanced BionicsのSpecRes(FFT+スペクトルピーク選択)・SineEx(心理音響モデルで知覚的に重要な正弦波を選択)が代表。ただし臨床試験では被験者間ばらつきが大きく平均成績は標準戦略と同程度のことが多い(confidence:medium)。
- 個別化マッピング: 術後CTで電極位置に基づく周波数マップを個別化。音声と音楽で最適な電極-神経インターフェースが異なる可能性(音声はモジオラス近接が有利、音楽はやや遠位が有利との示唆)。
- TFS符号化: FSP系は主観的に音楽で好まれることが多いが、雑音下音声・音楽の客観成績は一貫した優位を示さず、TFSを劣化した聴神経へ伝送するのは依然として工学的難題。
- 電気触覚刺激(electro-haptic stimulation; EHS): CI信号で伝送されにくい情報を触覚刺激で「増強」(置換ではない)。音声基本周波数(F0)や音声振幅包絡線を指等への触覚で提示すると雑音下音声認識が改善し、音源定位・音楽知覚の向上も示唆される。雑音入り信号から簡易ノイズリダクションで触覚信号を抽出しリアルタイム・小型機器で実装可能。非使用者・機器故障・両側手術後の聴覚遮断期など、CIを使えない/使えない集団の補完先としての可能性も提示(confidence:medium)。
- バイモーダル / 電気音響刺激(EAS): 残存音響聴力(対側補聴器)が低域TFSを供給し旋律認識・音楽享受を改善。ただし有用な残存聴力をもつ使用者は少なく術後劣化も速い。歌唱産生の正確性は群レベルで両側CIと有意差なしとの報告もある。
- 新規符号化 InterlACE: ACEのマキシマ選択を空間的・時間的に交互(alternating)なチャネル選択に置換し破棄信号を補償、両側同期へ拡張可能。両側CI5名の検証で雑音下音声明瞭度に有望な結果(スペクトルリップル弁別の改善は示せず)。大規模検証が必要(confidence:low・abstract-only暫定)。
- AI/データ駆動型: 個別化リハビリ・音声強調・リアルタイム適応制御等への応用が俯瞰されている(abstract-only暫定)。
評価・フィッティング・研究基盤
- 客観的フィッティング: 全現代機種が測定可能なECAP(電気誘発複合活動電位)の閾値は、プログラミングに要する高レート(≥500 pps)心理物理閾値との相関が弱い。Temporal Modelに高レート列中の各パルスのECAP振幅を組み込むと閾値対レート関数の傾き(個人差)を予測でき、客観的プログラミングや神経生存度推定への橋渡しになりうる(confidence:medium・実装は未確立)。
- 旋律輪郭同定(melodic contour identification; MCI): 音楽/ピッチ符号化の評価課題。F0符号化のうちSPP(1周期1パルス)刺激がMOD(高レート列のF0振幅変調)よりMCI成績が良好で、低F0範囲(97〜194 Hz)で成績が良い。ピッチランキングで報告された非対称ファントム刺激の優位はMCIでは再現されず(confidence:low・abstract-only暫定)。
- 研究プラットフォーム: CCi-MOBILEは携帯性と計算能力/柔軟性を両立し、実験室・実環境で多様なリアルタイム符号化アルゴリズムを実装・評価でき、同期両側刺激にも対応する研究基盤(confidence:low・abstract-only暫定)。
予後・経過
- 符号化戦略ごとの聴取成績の長期アウトカムは、戦略間で系統的に比較したSR/RCTが未取得(飽和目標)。改善戦略(EHS・電流ステアリング・FSP)の客観的優位は一貫せず、個人差が大きい。
最新トピック / 未解決の論点
- スペクトル分解能・TFSをいかに電極-神経インターフェース越しに伝送するかが中核課題。電流ステアリング・FSPとも客観的優位は不安定で、劣化した聴神経への精密刺激は依然工学的難題。
- マルチモーダル補完(EHS)と両耳統合(バイモーダル/EAS・両側同期符号化)が、信号処理単体の限界を回避する有望路。
- 客観的フィッティング(ECAP+ラウドネスモデル)による個別最適化と、AI/データ駆動型の適応制御が革新方向。
- どの戦略がどの患者・聴取課題で優れるかを系統的に比較した定量エビデンス(SR/メタ・RCT)は依然未取得(飽和目標)。
関連トピック
更新履歴
- 2026-06-03: 差分精読6本反映(全文3+abstract3)。全文精読の歌唱/音楽レビューを新アンカー(full-text)に設定し、信号処理の基本パイプライン・CIS/ACE/FSP・チャネル相互作用・スペクトル/TFS限界を具体化。EHS・ラウドネスモデル/客観的フィッティングを全文反映。研究プラットフォームCCi-MOBILE・旋律輪郭同定・新規符号化InterlACEを暫定反映。paper_count=3→9。anchor=40310887(abstract暫定)→41300199(full-text)。
- 2026-06-02: 差分精読(abstract-only 暫定)。AI×CIの俯瞰レビューと上行聴覚路・新興刺激戦略レビューを補足背骨として反映。paper_count=3。
- 2026-06-01: 初版作成(abstract-only 暫定)。符号化戦略の歴史的俯瞰レビューを暫定背骨として反映 。具体的戦略の比較SR/RCT取得を次回検討。
参照論文
- — アンカー: CI信号処理の限界(スペクトル/TFS)と歌唱・音楽知覚・改善戦略を統合したレビュー (Younan 2025, Brain Sci / narrative-review / Lv.5 / RoB:n/a / confidence:medium / full-text)
- — 統合: 電気触覚刺激(EHS)によるCI聴取改善のレビュー (Fletcher & Verschuur 2021, Front Neurosci / narrative-review / Lv.5 / RoB:n/a / confidence:medium / full-text)
- — 統合: 現象論的ラウドネスモデルのCI応用(客観的フィッティング・ECAP) (McKay 2021, Front Psychol / narrative-review / Lv.5 / RoB:n/a / confidence:medium / full-text)
- — 統合: CI研究プラットフォームCCi-MOBILEのリアルタイム符号化能力 (Azadpour 2025, J Acoust Soc Am / translational / Lv.5 / confidence:low / 暫定)
- — 統合: 旋律輪郭同定によるF0符号化(SPP vs MOD・非対称ファントム)の比較 (Macherey & Carlyon 2025, Ear Hear / translational / Lv.4 / confidence:low / 暫定)
- — 統合: 新規符号化戦略InterlACE(交互チャネル選択・両側同期) (Wohlbauer 2024, IEEE TBME / translational / Lv.4 / confidence:low / 暫定)
- — 統合: 約50年の人工内耳符号化戦略を俯瞰したレビュー (Wohlbauer & Dillier 2025, Annu Rev Biomed Eng / narrative-review / Lv.5 / RoB:n/a / confidence:low / 暫定)
- — 統合: AIを活用したCI技術革新(信号処理・音声強調・適応制御)の俯瞰レビュー (Zhang 2025, Bioeng Transl Med / narrative-review / Lv.5 / RoB:n/a / confidence:low / 暫定)
- — 統合: 上行聴覚路の信号処理と従来型・新興(オプトジェネティクス)神経刺激戦略のレビュー (Quimby 2023, Front Neurosci / narrative-review / Lv.5 / RoB:n/a / confidence:low / 暫定)