人工内耳の信号処理（Cochlear Implant Signal Processing / Coding Strategies）

⚠️ 医療者向け研究レビュー。診療判断・医学的助言ではない。最終判断は一次資料と専門家の評価による。最終更新: 2026-06-13 ／反映論文: 15件（うち全文精読4件・abstract-only暫定8件）／未レビュー

サマリ（現時点の到達点）

人工内耳(CI)の信号処理（符号化戦略, coding strategy）は、マイクで捉えた音響信号を電極-神経インターフェース上の電気パルスへ変換する一連のアルゴリズム（前処理・帯域分割・包絡線抽出・電気信号生成）を指す。基本パイプラインは、入力音を有限個（機種により12〜22）の周波数チャネルに分割し、各チャネルの包絡線(envelope)を電気パルスに変換、蝸牛の周波数局在(tonotopy)に対応する電極へ送るものである。従来の主要戦略（CIS、ACE）は主に時間包絡線（おおむね2〜50 Hzの緩やかな振幅変動）を抽出・伝送し、これは音素同定・静寂下の基本的音声認識に十分だが、スペクトル分解能と時間微細構造(temporal fine structure; TFS)は良好に伝送されない。この限界がピッチ・音色・声の韻律・音楽知覚の劣化と雑音下聴取困難を生む。改善アプローチとして、スペクトル強調（電流ステアリング＝仮想チャネル）、TFS符号化（FSP系）、個別化マッピング、電気触覚刺激(EHS)、バイモーダル/電気音響刺激、新規符号化（InterlACE）などが研究されている。新着差分では、内耳奇形例に三相性刺激が有効な一方で正常内耳構造例では不利になりうる病態選択性、TIPSが語音SRT改善を再現できない一方で推定消費電力を21–42%削減しうること、神経活動ベースvocoder NeuroVocがCIシミュレーション研究基盤になりうることを追加した。

カバレッジ（この知識の確からしさ範囲）

背骨(anchor): — 歌唱・音楽知覚を軸にCI信号処理の限界と改善戦略を統合したナラティブレビュー・2025（Brain Sci）。全文精読済。SR/メタ解析ではない（SANRA観点で網羅性は非保証）が、符号化の機序・戦略名・周波数帯・チャネル相互作用を具体的に記述。
全文精読(full-text)済: （信号処理の基本・限界・改善）、（電気触覚刺激EHS）、（ラウドネスモデルと客観的フィッティング）、（TIPSの追試・電力削減）。
abstract-only暫定: （CCi-MOBILE研究プラットフォーム・全文未取得）、（旋律輪郭同定MCI・F0符号化比較）、（新規符号化InterlACE）、（内耳奇形例の三相性刺激）、（NeuroVoc）。加えて前巡の俯瞰レビュー・AI応用・上行聴覚路（いずれもprovisional-abstract）。全文入手で要再評価・昇格。
飽和目標: 符号化戦略を系統的に比較するSR/メタ解析・大規模RCT（CIS vs ACE vs FSP等の戦略間比較、音楽知覚・雑音下聴取の改善）と、改善戦略（EHS・電流ステアリング・新規符号化）の確証的RCTを次回優先で取得し、定量的エビデンスを補強する。

病態・基礎（信号処理パイプラインと限界）

パイプライン: マイク入力 → 帯域分割（バンドパスフィルタバンク、機種により12〜22チャネル）→ 各チャネルの包絡線抽出 → 蝸牛周波数局在に対応する電極への電流パルス生成。ラウドネスは電気刺激パラメータ（パルスレート・電流レベル・電極数）に依存し、現象論的モデル（時間積分窓・電極相互作用・specific loudness変換）で説明される。
符号化戦略:
- CIS（Continuous Interleaved Sampling）/ ACE（Advanced Combination Encoder）: 主に時間包絡線を抽出・伝送する従来主流。包絡線手がかりは音素同定・静寂下音声認識に有効。ACEは各時刻でエネルギーの大きいチャネル（マキシマ）を選択するn-of-m型。
- FSP（Fine Structure Processing）/ FS4 / FS4-p（MED-EL）: 中〜高域チャネルは包絡線型(CIS様)、最尖端3〜4チャネル（低域）はフィルタ波形のゼロ交差にパルスを同期させTFSを明示的に符号化。FS4-pは尖端の並列刺激でTFS表現を強化。
スペクトル分解能の限界: 電極チャネル数の少なさ、場所-ピッチ不一致(place-pitch mismatch)、広いバンドパスフィルタ、電流の広がり→チャネル相互作用(channel interaction)＝隣接電極の重複興奮＝スペクトルの滲み(spectral smearing)。電極相互作用は蝸牛レベルのラウドネスモデルにも組み込まれる。
TFSの限界: TFS（おおむね600〜10000 Hzの波形微細変動、位相・タイミングを符号化）は良好に伝送されず、細かいピッチ知覚・雑音下音声理解・音源分離に不可欠な手がかりが失われる。
帰結: ピッチ/旋律知覚不良（小さなピッチ変化の弁別困難）、音色弁別困難、声の韻律(prosody)・感情認識の障害、雑音下聴取困難、音源定位困難、音楽享受の大幅低下。歌唱では聴覚-運動フィードバックループが破綻し、約6半音規模の粗い誤差にしか反応しなくなる。

診断

本トピックは信号処理アルゴリズム（基礎・デバイス）が主であり、診断的位置づけは中心ではない。臨床的適応・診断は人工内耳を参照。

治療・応用（改善アプローチ）

スペクトル情報の強調: 電流ステアリング(current steering)で隣接2電極へ同時通電し物理電極間に「仮想チャネル(virtual channel)」を作り、弁別可能なピッチ知覚を増やす。Advanced BionicsのSpecRes（FFT＋スペクトルピーク選択）・SineEx（心理音響モデルで知覚的に重要な正弦波を選択）が代表。ただし臨床試験では被験者間ばらつきが大きく平均成績は標準戦略と同程度のことが多い（confidence:medium）。
個別化マッピング: 術後CTで電極位置に基づく周波数マップを個別化。音声と音楽で最適な電極-神経インターフェースが異なる可能性（音声はモジオラス近接が有利、音楽はやや遠位が有利との示唆）。
TFS符号化: FSP系は主観的に音楽で好まれることが多いが、雑音下音声・音楽の客観成績は一貫した優位を示さず、TFSを劣化した聴神経へ伝送するのは依然として工学的難題。
電気触覚刺激(electro-haptic stimulation; EHS): CI信号で伝送されにくい情報を触覚刺激で「増強」（置換ではない）。音声基本周波数(F0)や音声振幅包絡線を指等への触覚で提示すると雑音下音声認識が改善し、音源定位・音楽知覚の向上も示唆される。雑音入り信号から簡易ノイズリダクションで触覚信号を抽出しリアルタイム・小型機器で実装可能。非使用者・機器故障・両側手術後の聴覚遮断期など、CIを使えない/使えない集団の補完先としての可能性も提示（confidence:medium）。
バイモーダル / 電気音響刺激(EAS): 残存音響聴力（対側補聴器）が低域TFSを供給し旋律認識・音楽享受を改善。ただし有用な残存聴力をもつ使用者は少なく術後劣化も速い。歌唱産生の正確性は群レベルで両側CIと有意差なしとの報告もある。
新規符号化 InterlACE: ACEのマキシマ選択を空間的・時間的に交互(alternating)なチャネル選択に置換し破棄信号を補償、両側同期へ拡張可能。両側CI5名の検証で雑音下音声明瞭度に有望な結果（スペクトルリップル弁別の改善は示せず）。大規模検証が必要（confidence:low・abstract-only暫定）。
三相性刺激（病態選択的刺激波形・abstract暫定）: 内耳奇形(IEM)のCI装用者20例と正常内耳構造(NIE)20例の被験者内比較で、三相性刺激はIEM群の静寂下TURMatrixを+19%、SRTを9.5 dB、雑音下adaptive SNRを5.8 dB、語音弁別を+10.8%改善し、RGDTも6.6 ms改善した。一方、NIE群では静寂下TURMatrix -9.6%、語音弁別 -6.3%、SRT +4 dBと不利。三相性刺激は副刺激/顔面神経刺激でダイナミックレンジが狭い奇形例の個別化戦略であり、正常構造例へ一律適用する根拠はない（confidence:medium・全文未取得）。
TIPS（Temporal Integrator Processing Strategy・全文精読）: 時間マスキングモデルで知覚されにくい刺激パルスを削減するTIPSは、CIS/ACEと比べ群平均の雑音下SRT改善を再現しなかった。CIS+TIPS50でspeech-shaped noise中央値SRT -1.38 vs -1.62 dB、多話者雑音1.88 vs 0.74 dBだが有意な戦略主効果なし。ACE比較でもTIPS33/TIPS50の主効果なし。ただし推定消費電力はCIS+TIPS50で42.3%、ACE+TIPS33で21.8%、ACE+TIPS50で33.6%削減し、語音明瞭度を大きく損なわない省電力戦略としては有望（confidence:medium）。実時間実装では後向きマスキング窓による遅延問題がある。
AI/データ駆動型: 個別化リハビリ・音声強調・リアルタイム適応制御等への応用が俯瞰されている（abstract-only暫定）。

評価・フィッティング・研究基盤

客観的フィッティング: 全現代機種が測定可能なECAP（電気誘発複合活動電位）の閾値は、プログラミングに要する高レート(≥500 pps)心理物理閾値との相関が弱い。Temporal Modelに高レート列中の各パルスのECAP振幅を組み込むと閾値対レート関数の傾き（個人差）を予測でき、客観的プログラミングや神経生存度推定への橋渡しになりうる（confidence:medium・実装は未確立）。
旋律輪郭同定(melodic contour identification; MCI): 音楽/ピッチ符号化の評価課題。F0符号化のうちSPP（1周期1パルス）刺激がMOD（高レート列のF0振幅変調）よりMCI成績が良好で、低F0範囲(97〜194 Hz)で成績が良い。ピッチランキングで報告された非対称ファントム刺激の優位はMCIでは再現されず（confidence:low・abstract-only暫定）。
研究プラットフォーム: CCi-MOBILEは携帯性と計算能力/柔軟性を両立し、実験室・実環境で多様なリアルタイム符号化アルゴリズムを実装・評価でき、同期両側刺激にも対応する研究基盤（confidence:low・abstract-only暫定）。
神経活動ベースvocoder（NeuroVoc・abstract暫定）: 聴神経モデルのneurogramから逆フーリエ変換で音響波形を再構成するモデル非依存フレームワーク。正常聴覚(NH)モデルでは調波構造が保たれ、電気聴覚(EH)モデルでは雑音下DINのSRTが標準音声より+7.1 dB悪化してCI臨床報告値と整合した。戦略専用vocoderを個別実装せず、NH/EHモデルを同じ枠組みで比較する研究基盤として有用（confidence:low・全文未取得）。

予後・経過

符号化戦略ごとの聴取成績の長期アウトカムは、戦略間で系統的に比較したSR/RCTが未取得（飽和目標）。改善戦略（EHS・電流ステアリング・FSP）の客観的優位は一貫せず、個人差が大きい。

このトピックに反映した論文カードを一覧で見るこのトピックの知識更新の履歴を見る

人工内耳の信号処理（Cochlear Implant Signal Processing / Coding Strategies）

サマリ（現時点の到達点）

カバレッジ（この知識の確からしさ範囲）

病態・基礎（信号処理パイプラインと限界）

診断

治療・応用（改善アプローチ）

評価・フィッティング・研究基盤

予後・経過

最新トピック / 未解決の論点

新着アブストラクト知見（2026-06-08）

新着アブストラクト知見（2026-06-13）

関連トピック

更新履歴

参照論文