嗅覚検査(Olfactory Testing)
⚠️ 医療者向け研究レビュー。診療判断・医学的助言ではない。最終判断は一次資料と専門家の評価による。 最終更新: 2026-06-04 / 反映論文: 13件(背骨+治療効果判定SR〔全文〕・嗅覚評価法比較レビュー・cross-cultural妥当性・臨床応用〔認知症/COVID後〔全文〕/高齢者〕・小児検査・味覚検査) / 一部全文精読・他はabstract-only暫定 / 未レビュー
サマリ(現時点の到達点)
嗅覚検査の核心は、患者の自己申告が客観的嗅覚評価と相関が乏しいため、妥当性検証済みの心理物理検査(psychophysical testing)を実施する点にある。臨床で広く用いられる心理物理検査は Sniffin' Sticks(閾値 Threshold・識別 Discrimination・同定 Identification の3要素=TDI) と UPSIT(University of Pennsylvania Smell Identification Test、SIT-40) で、いずれも世界的に文化的・言語的に適応され、正常嗅覚者(normosmic)と嗅覚障害者を区別するスクリーニング検査も整備されている。これに加え、質的障害(異臭症・幻臭・嗅覚過敏)とQOLを測る患者報告アウトカム尺度(PROM)である Smell-Qx が開発・検証され、信頼性・判別妥当性が示された(小規模・単施設・二極設計で確実性は限定的)。重要なのは、PROM と心理物理検査(TDI)は別側面(主観・質的 vs 量的)を測るため、両者を組み合わせるマルチモーダル評価が推奨される点である。 嗅覚検査の臨床的意義は嗅覚障害の診断・経過追跡にとどまらず、標準化検査スコア(UPSIT-40・Sniffin' Sticks TDI・簡易同定 B-SIT)はうつ病との関連(うつ群でスコア低下、SMD -0.37)や、神経変性疾患の早期/鑑別マーカー(早期Parkinson病の90%・早期Alzheimer病の85%に嗅覚障害;UPSIT-Jで4型認知症が非認知症より低スコア、ただしAD/DLBの型別鑑別は不可)、高齢者の機能予後(B-SIT嗅覚不良で移動能力低下を予測)の評価にも用いられている。なお欧米由来の同定検査を未改変で他文化集団に用いると健常者を過剰に嗅覚低下と誤判定するため、集団ごとの正常値設定(cross-cultural妥当性検証)が必須である。検査法は主観的(自己評価)と客観的(心理物理)に大別され、客観検査が現状のゴールドスタンダードだが費用・専門性・時間が課題で、両者を統合するハイブリッド評価が志向される。
カバレッジ(この知識の確からしさ範囲)
- 背骨(anchor): PMID:36120187 — 化学感覚障害の心理物理検査ナラティブレビュー(2022, Curr Otorhinolaryngol Rep)。検査法の枠組み(Sniffin' Sticks/UPSIT・TDI)を提供。
- 反映範囲: アンカーの検査枠組み+差分(2021–2025)として、嗅覚評価法の主観/客観比較レビュー、cross-cultural妥当性(SS vs UPSIT)、臨床的意義に関するSR/MA(うつ・加齢/神経変性)と嗅覚PROM Smell-Qx、臨床応用(認知症型別UPSIT-J・COVID後TDI〔全文〕・高齢者予後B-SIT)を反映。
- 暫定(全文未取得): PMID:36120187 / PMID:35360974 / PMID:34325072 / PMID:40580020 / PMID:41026510 / PMID:37963486 / PMID:38236595 はアブストラクトのみ(provisional-abstract)。各検査の感度特異度・カットオフ値、メタ解析の異質性・組入研究RoB、有病率の段階別定義は未確定。Smell-Qx・COVID後TDIは full-text。
- 飽和目標: 嗅覚心理物理検査(Sniffin' Sticks TDI・UPSIT/SIT-40)の診断精度・正常閾値、嗅覚電気生理(嗅覚誘発電位 OERP・客観的)、日本独自の検査(T&T基準嗅力検査・OSIT-J/Open Essence・静脈性嗅覚検査〔アリナミンテスト〕)、質的障害の客観評価(SSParoT)のSR・GLは全文入手後に補強。
検査の枠組み(心理物理検査)
心理物理検査の原則と主要ツール
- 基本原則: 患者の自己申告は客観的嗅覚・味覚評価と相関が乏しいため、臨床・研究の双方で妥当性検証済みの心理物理検査を行うべき。
- Sniffin' Sticks: 閾値(Threshold)・識別(Discrimination)・同定(Identification)の3サブテストの合計が TDIスコア。COVID-19を契機に検査法の開発が加速し、各国語版へ文化的・言語的適応が進んだ。
- UPSIT / SIT-40: スクラッチ&スニフ式の同定検査(40項目)。標準化嗅覚検査として広く用いられ、メタ解析でも比較指標に採用される。
- スクリーニング検査: 正常嗅覚者(normosmic)と嗅覚障害者を区別する目的で開発が進む。自己評価・スクリーニングの進歩により、標準化された同定・正式評価への経路が期待される。B-SIT(Brief Smell Identification Test、12項目の簡易同定スクリーニング) は大規模疫学研究で広く用いられ、good 11-12 / moderate 9-10 / hyposmia 7-8 / anosmia 0-6 のカットオフで分類される(confidence:medium・abstract暫定)。
- 検査の3要素の臨床的意味: COVID後嗅覚障害をSS全TDI(48点満点)で評価した単群研究では、閾値(Threshold)パートが最も低下し、識別・同定は相対的に保たれた=刺激強度が十分なら誤りが減ることを示し、TDIをサブパート別に分解すると病態局在(末梢優位/中枢優位)の手がかりになりうる(confidence:medium・full-text)。SS合計の診断カットオフは >30=normosmia、16〜30=hyposmia、≤15=anosmia(Hummel基準)。
- ※ Sniffin' Sticks/UPSIT 各検査の感度・特異度の定量比較・診断精度はなお未取得(全文入手で補強予定、confidence:medium)。
嗅覚評価法の主観 vs 客観(比較レビュー・差分)
- 現行の嗅覚評価法は 主観的(subjective=自己評価) と 客観的(objective=心理物理 psychophysical) に大別される。
- 主観的評価: 簡便・低コストだが、個人の嗅覚知覚差・認知バイアスにより信頼性にばらつき。
- 客観的(心理物理)検査: 精密・標準化された定量データを与え現在のゴールドスタンダードだが、コスト・専門性・所要時間が実用上の制約。
- 方向性: 自己申告と妥当性検証済み客観指標を統合する「ハイブリッドモデル」の精緻化が今後の課題(confidence:medium・abstract暫定、個別検査の感度・費用の具体比較は全文未取得)。
cross-cultural妥当性(検査特性・差分)
- 欧米由来の同定検査を未改変のまま他文化集団へ用いると、なじみのない嗅素の多さ(SS 43.8% / UPSIT 47.5%)により健常者を過剰に「嗅覚低下」と誤判定する。シンガポール健常成人(n=50, 平均34歳)では、欧米正常値で hyposmia/anosmia と分類された割合が SS 44.0% / UPSIT 92.0% に達した。
- 同一被験者でのSS(同定16点)とUPSIT(40点)の一致は最小(weighted Cohen's kappa -0.020, 95%CI -0.240〜0.101, P=0.626)=検査ごとに測る同定能が異なり互換性が低い。
- 集団別正常値で補正すると患者の診断が SS 13.9%・UPSIT 25.7% で変化=スコア解釈には集団ごとの正常値設定(adapt & validate)が必須(confidence:medium・abstract暫定、小規模・若年偏重)。
治療効果判定の標準(全文精読SR)
- 感冒後嗅覚障害(PVOD)の治療効果は Sniffin' Sticks の TDI(閾値+識別+同定) を評価標準軸とし、臨床的に意味のある最小変化量(MCID)=TDI ≥6点上昇 が効果判定の基準値となる。研究間で検査法が不統一(UPSIT/BTT/T&T/CCSIT等)である点が標準化の課題で、例として全身ステロイドでTDI 14.39→18.86(p=0.003)、長期嗅覚トレーニングのMCID到達率は12週37%→32週79%と報告される(confidence:medium)。
小児の嗅覚検査(差分)
- 成人用検査は注意持続・言語発達・嗅覚経験不足のため小児に適用困難で、妥当性・信頼性・正常値・利用可能性の観点から U-Sniff / Sniffin' Sticks閾値 / pBOT-6 / NIH-Toolbox / Smell Wheel が推奨される。同定検査は整備済みだが小児用の閾値・識別ツールは未充足(confidence:medium・abstract暫定)。
臨床的意義(scope: 周辺証拠)
嗅覚検査そのものではなく、検査スコアが他病態の評価に用いられる例。中核(検査法の妥当性)に対する周辺的エビデンス。
嗅覚機能とうつ病(メタ解析)
- 標準化嗅覚検査でうつ群が対照より低スコア: UPSIT-40 SMD = -0.37(95%CI -0.66〜-0.08, P=0.0123)、Sniffin' Sticks の閾値・識別・同定も低下。
- 効果量は小さく、検索期間が2019年12月以降に限定・組入研究のRoB/異質性が不明なため確実性は低い(横断的関連で因果は不明)(confidence:low)。
嗅覚障害と神経変性疾患の早期バイオマーカー(系統的レビュー)
- 嗅覚障害(OD)は早期Parkinson病の90%・早期Alzheimer病の85%にみられ、早期診断バイオマーカーとして注目される。
- ヒト用の広く使われる嗅覚検査群と動物モデル評価を横断的に概観。ただしODは非特異的で特異度に限界、有病率は段階定義に依存(confidence:low)。
認知症型別の嗅覚同定検査(UPSIT-J・横断研究)
- 日本語版UPSIT(UPSIT-J)の同定スコア(nODS)は、4型の認知症(Alzheimer型・混合型・血管型・Lewy小体型)すべてで非認知症群より有意に低い。
- nODSは認知機能・脳萎縮と相関: HDS-R r=0.567・MMSE r=0.532(正)・CDR r=-0.578(負)・VSRAD Zスコア r=0.463。
- ただしAD群とDLB群でnODSに有意差なし=型別鑑別力には限界(嗅覚同定低下は非特異的)(confidence:medium・横断・単施設)。
COVID-19後の持続性嗅覚障害(SS全TDI・全文精読)
- COVID後の主観的嗅覚障害81名(感染後平均8.3ヶ月)をSS全TDIで評価: anosmia 22%・hyposmia 64%・normosmia 14%。
- 閾値パートが最も低下し識別・同定は相対的に良好=末梢優位の障害像を示唆。
- phantosmia 36%(多くはタバコ/焦げ臭)だが嗅覚感度とは無相関(合計 U=720.5, p=0.741)。性差・年齢群差なし。嗅覚-味覚相関は弱く非有意(合計 rho=0.16, p=0.165)(confidence:medium・単群・女性偏重)。
高齢者の予後マーカー(B-SIT・前向きコホート)
- 簡易同定スクリーニング B-SIT のベースライン嗅覚不良は、2500名(平均75.6歳)を最長10年追跡したコホートで移動能力低下を予測。
- 20m通常歩行の年間低下が good 群比で hyposmia -0.004 m/s/年(95%CI 0.002-0.007)・anosmia -0.01(0.007-0.013) 速く、400m歩行不能のオッズは anosmia群で year10 OR 2.73(1.40-5.35)。
- 嗅覚検査スコアが障害の診断を超えて機能予後の指標になりうることを示す(残余交絡・潜在的神経変性による逆因果は否定できず)(confidence:medium・観察研究・abstract暫定)。
該当検査の妥当性
Smell-Qx(嗅覚・味覚PROM)— 開発と測定特性
- 構成: 11ドメイン。うち5コアドメインで合計スコア(APPOTスコア=Anosmia/Hyposmia・Parosmia・Phantosmia・Olfactory Intolerance・Taste)を算出、6ドメインは病歴・QOL把握用。文献SR(34件→22尺度)+384項目抽出+2巡Delphi+専門家パネルで開発(COMET準拠)。
- 信頼性: 内的一貫性 Cronbach's α 0.64–0.97(異臭症0.97・味覚0.87・QOL0.95・嗅覚消失0.77・幻臭0.64、嗅覚過敏は1項目で算出せず)。再検査信頼性 ICC 0.65–0.99(全体APPOT 単一0.95/平均0.97、平均間隔15.2日、n=17)。
- 判別妥当性(既知群): SATD群 APPOTスコア9.2(95%CI 7.43–10.97)vs 対照0、判別 t=9.99(df=58, p<0.0001)。
- 妥当性(相関): SATD関連QOLと r=0.43(p=0.015)、SNOT-22嗅覚項目と r=0.82(併合的妥当性, p<0.0001)。
- 心理物理検査との関係: 全体APPOTスコアと Sniffin' Sticks 全体TDIは無相関(r=-0.11, p=0.55)だが、嗅覚消失ドメインは全体TDIと有意な負の相関 r=-0.54(p=0.011)。これはPROMと心理物理検査が異なる嗅覚側面を測る(量的 vs 主観・質的)ことを支持し、併用の根拠となる(confidence:medium)。
味覚検査との対比(差分・周辺)
- 嗅覚検査(UPSIT/Sniffin' Sticks)が標準化済みであるのと対照的に、味覚検査には客観的な標準法が存在しない。味覚低下の訴えの多くは実は嗅覚障害であり、味覚愁訴では嗅覚検査の併施が重要とされる(confidence:low・周辺、味覚障害)。
- 味覚選択的障害の例として、GLP-1受容体作動薬使用者はWETT味覚スコアが低下(28.61 vs 対照40.63, p<0.001)する一方、UPSIT嗅覚は有意差なし(p=0.076)=嗅覚を対照軸に味覚選択的障害を立証した方法論的事例(著者にメーカー利益相反あり)(confidence:medium・周辺)。
関連トピック
- 嗅覚障害 — 嗅覚障害(本検査が対象とする病態)
- 味覚障害 — 味覚障害。化学感覚検査として対比、味覚愁訴では嗅覚検査併施が重要
- 感冒後・COVID-19嗅覚障害 — ウイルス感染後嗅覚障害(質的障害・異臭症の主要原因。Smell-Qxの主対象の一つ)
- 異嗅症 — 異臭症(質的嗅覚障害。心理物理検査では捉えにくくPROM/専用検査が必要な側面)
更新履歴
- 2026-06-04: 嗅覚評価法の主観/客観比較レビュー、cross-cultural妥当性(SS vs UPSIT, kappa≈0・過剰診断)、臨床応用として認知症型別UPSIT-J・COVID後嗅覚のSS全TDI(閾値最低=末梢優位、全文精読)・高齢者のB-SITと移動能力予後を差分反映。検査の枠組みにB-SIT・TDIサブパート分解・cross-cultural節を追加。paper_count 8→13。動物行動試験レビューはヒト嗅覚検査の方法論に資さずscope外で却下。
- 2026-06-03: 治療効果判定の標準(TDI MCID≥6・全文SR)、小児嗅覚検査ツール、味覚検査の標準法欠如・GLP-1味覚選択的障害を差分反映。related に taste-disorder 追加。paper_count 4→8。
- 2026-06-02: 背骨を心理物理検査レビューに変更し、検査の枠組み(Sniffin' Sticks=TDI、UPSIT/SIT-40、主観-客観の乖離)を追記。臨床的意義の周辺証拠としてうつ病との関連MA・神経変性疾患の早期バイオマーカーSRを scope 明記で反映(いずれもアブストラクトのみ=provisional、confidence:low)。related に 異嗅症 追加。
- 2026-06-01: 初版作成。Smell-Qx PROMの開発・妥当性SR+検証を背骨に、嗅覚PROMの信頼性・判別妥当性・心理物理検査との関係(量的/主観の乖離)を反映(confidence:medium、RoB:high)。
参照論文
- — 新知見: 化学感覚障害の心理物理検査を統合し主観-客観の乖離→妥当性検証済み検査の必要性を提示(Sniffin' Sticks/UPSIT・TDIの枠組み) (Fahmy 2022, Curr Otorhinolaryngol Rep / narrative-review / Lv.5 / RoB:n/a / confidence:med)
- — 新知見: 質的嗅覚障害・QOLを含む嗅覚味覚PROM「Smell-Qx」を文献SR+Delphiで開発・検証(信頼性良好、TDIとは別側面を測定) (Lechner 2025, Int Forum Allergy Rhinol / diagnostic-accuracy / Lv.4 / RoB:high / confidence:med)
- — 新知見: 標準化嗅覚検査(UPSIT-40・Sniffin' Sticks)でうつ群が低スコア(SMD -0.37)=検査の臨床的意義の周辺証拠 (Kim 2025, Ear Nose Throat J / sr-ma / Lv.3 / RoB:high / confidence:low)
- — 新知見: 嗅覚障害を神経変性疾患の早期バイオマーカーと位置づけ(早期PD 90%・早期AD 85%)=検査の臨床的意義の周辺証拠 (Dan 2021, Ageing Res Rev / sr-ma / Lv.3 / RoB:high / confidence:low)
- — 全文精読SR: PVOD治療効果を心理物理検査で定量、TDI MCID≥6を効果判定基準に (Yuan 2021, Laryngoscope / sr-ma / Lv.3 / confidence:medium)
- — 小児: 小児向け心理物理嗅覚検査(U-Sniff/pBOT-6等)を妥当性で評価・推奨 (Gellrich 2021, narrative-review / Lv.5 / confidence:medium / 暫定)
- — 周辺: 味覚検査の概観、嗅覚と対照的に客観的標準法なし・味覚愁訴に嗅覚検査併施 (Payne 2023, StatPearls / narrative-review / Lv.5 / confidence:low / 暫定)
- — 周辺: GLP-1 RAが味覚を選択的に障害(WETT低下・嗅覚は陰性)、嗅覚を対照軸とした方法論事例 (Khan & Doty 2025, case-control / Lv.4 / confidence:medium / 暫定)
- — 中核: 嗅覚評価法を主観/客観で整理し費用・信頼性・実用性で比較、ハイブリッドモデルを提唱 (Patel 2025, Ear Nose Throat J / narrative-review / Lv.5 / RoB:high / confidence:medium / 暫定)
- — 検査特性: シンガポールでSS同定 vs UPSITを比較、欧米正常値で過剰診断・両検査の一致最小(kappa≈0)=cross-cultural妥当性検証の必要 (Zhang 2025, Singapore Med J / diagnostic-accuracy / Lv.4 / RoB:high / confidence:medium / 暫定)
- — 臨床応用: UPSIT-J同定スコアが4型認知症で低下し認知機能・脳萎縮と相関(AD/DLB型別鑑別は不可) (Yamashita 2024, Psychogeriatrics / cross-sectional / Lv.4 / RoB:high / confidence:medium / 暫定)
- — 全文精読 臨床応用: COVID後嗅覚をSS全TDIで評価、閾値パートが最低=末梢優位を示唆、SS診断カットオフ提示 (Buksinska 2024, Life / cross-sectional / Lv.4 / RoB:high / confidence:medium)
- — 臨床応用: B-SIT嗅覚不良が高齢者2500名で移動能力低下・歩行不能を予測(anosmia year10 OR 2.73) (Yuan 2024, JAMA Otolaryngol Head Neck Surg / cohort / Lv.3 / RoB:some-concerns / confidence:medium / 暫定)
却下(scope外)
- — Alzheimer病5xFADマウスの行動指標レビュー。運動/感覚/学習記憶/精神様症状の4領域を扱い嗅覚は感覚の一項目に過ぎず、ヒト嗅覚検査の方法論・特性・臨床応用に資する内容なし=scope外で却下 (Pádua 2024, Int J Mol Sci / narrative-review)