[{"data":1,"prerenderedAt":75},["ShallowReactive",2],{"topic-diagnostic-accuracy-studies":3},{"id":4,"title":5,"category":6,"top":7,"sub":8,"tags":9,"related":16,"anchor":19,"coverage":20,"paper_count":21,"last_updated":22,"last_fetched":22,"html":23,"toc":24,"referencedPmids":62},"diagnostic-accuracy-studies","診断精度研究の方法論","基礎\u002F研究方法論EBM","基礎","研究方法論EBM",[10,11,12,13,14,15],"研究方法論","EBM","診断精度","STARD","STARD-AI","QUADAS-2",[17,18],"guideline-development-grade","patient-reported-outcomes-ent","PMID:32356885 (2020, sr-ma \u002F STARD遵守SR \u002F JAMA Netw Open)","アンカー=2020 STARD遵守SR(POCUS) \u002F STARD遵守の領域横断知見(画像・バイオマーカー・AI)・STARD-AI(2025)・QUADAS-2・HSROC・閾値効果・妥当性\u002F信頼性・内部\u002F外部検証を反映 \u002F 飽和目標: STARD2015原著・STARD-AI全文・QUADAS-2原著・PRISMA-DTA・Cochrane DTAハンドブックの一次資料取得",11,"2026-06-04","\u003Ch1>診断精度研究の方法論（Diagnostic Accuracy Studies — Methodology）\u003C\u002Fh1>\n\u003Cblockquote>\n\u003Cp>⚠️ 医療者向け研究レビュー。診療判断・医学的助言ではない。最終判断は一次資料と専門家の評価による。\n最終更新: 2026-06-04 ／ 反映論文: 11件（うち全文精読7件 \u002F abstract暫定4件） ／ 未レビュー\u003C\u002Fp>\n\u003C\u002Fblockquote>\n\u003Ch2 id=\"sec-1\">サマリ（現時点の到達点）\u003C\u002Fh2>\n\u003Cp>本トピックは「診断精度研究をどう設計・報告・批判的吟味するか」を扱う方法論総論である。中核は ①\u003Cstrong>精度指標\u003C\u002Fstrong>（感度・特異度・陽性\u002F陰性尤度比・診断オッズ比・AUC、事前確率と組み合わせた事後確率、さらに妥当性validity・信頼性reliability）、②\u003Cstrong>研究デザイン\u003C\u002Fstrong>（横断・前向きコホート・症例対照、参照標準、連続抽出、有病率を組み込んだサンプルサイズ計算、検証\u002Fスペクトラムバイアス）、③\u003Cstrong>報告ガイドライン STARD 2015／AI向け STARD-AI（2025）\u003C\u002Fstrong>、④\u003Cstrong>バイアス評価 QUADAS-2\u003C\u002Fstrong>、⑤\u003Cstrong>診断精度メタ解析\u003C\u002Fstrong>（PRISMA-DTA、bivariate\u002FHSROCモデル、閾値効果）、⑥\u003Cstrong>AI・予測モデル型診断精度の課題\u003C\u002Fstrong>である。\u003C\u002Fp>\n\u003Cp>到達点として、STARD遵守を複数領域で評価したSR群から「\u003Cstrong>どのSTARD項目が落ちやすく、それがどのバイアスに直結するか\u003C\u002Fstrong>」「STARD公表後も報告質は自動改善しない」「IF・デザインと報告質は無関係」といった横断的知見が固まった \u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40481407\">PMID:40481407\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37541083\">PMID:37541083\u003C\u002Fbutton>（confidence:high〜medium）。また診断精度MAの実務（QUADAS-2 + HSROC、症例対照混入による過大評価、閾値効果でメタ解析が不能になる構造、内部検証 vs 外部検証）の具体例も整理した \u003Cbutton class=\"pmid-ref\" data-pmid=\"37925910\">PMID:37925910\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37885475\">PMID:37885475\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"35699441\">PMID:35699441\u003C\u002Fbutton>（confidence:medium）。\u003C\u002Fp>\n\u003Ch2 id=\"sec-2\">カバレッジ（この知識の確からしさ範囲）\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>背骨(anchor): \u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton> — STARD 2015 遵守を急性期POCUS診断精度研究74件で項目別に定量化したSR（JAMA Netw Open, 2020, 全文精読）。方法論SRとして本トピックの背骨に適合。\u003C\u002Fli>\n\u003Cli>反映範囲: 全文精読7件 \u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40481407\">PMID:40481407\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37885475\">PMID:37885475\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"35699441\">PMID:35699441\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"38831134\">PMID:38831134\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40842435\">PMID:40842435\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"39513207\">PMID:39513207\u003C\u002Fbutton> ＋ abstract暫定4件 \u003Cbutton class=\"pmid-ref\" data-pmid=\"37541083\">PMID:37541083\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37925910\">PMID:37925910\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40954311\">PMID:40954311\u003C\u002Fbutton>（および従来の領域外事例\u003Cbutton class=\"pmid-ref\" data-pmid=\"40975951\">PMID:40975951\u003C\u002Fbutton>）。\u003C\u002Fli>\n\u003Cli>暫定(全文未取得): \u003Cbutton class=\"pmid-ref\" data-pmid=\"37541083\">PMID:37541083\u003C\u002Fbutton>（脳動脈瘤画像のSTARD遵守, 非OA）、\u003Cbutton class=\"pmid-ref\" data-pmid=\"37925910\">PMID:37925910\u003C\u002Fbutton>（AI-ACSのDTA MA, 非OA）、\u003Cbutton class=\"pmid-ref\" data-pmid=\"40954311\">PMID:40954311\u003C\u002Fbutton>（STARD-AI報告ガイドライン, Nat Med 非OA — 18追加項目の各内容・E&amp;E文書は未確認）。\u003C\u002Fli>\n\u003Cli>方法論サンプル（非ENT・低confidence）: \u003Cbutton class=\"pmid-ref\" data-pmid=\"39513207\">PMID:39513207\u003C\u002Fbutton>（STARD準拠の前向き診断精度研究の実装例）、\u003Cbutton class=\"pmid-ref\" data-pmid=\"40842435\">PMID:40842435\u003C\u002Fbutton>（STARD+QUADAS-2でのPOC検査精度比較SR）、\u003Cbutton class=\"pmid-ref\" data-pmid=\"38831134\">PMID:38831134\u003C\u002Fbutton>（妥当性validity・信頼性reliabilityの測定特性評価SR）。題材はENT外だが「診断精度研究の作法」として採用。\u003C\u002Fli>\n\u003Cli>飽和目標: \u003Cstrong>STARD 2015 原著・STARD-AI 全文(18項目)・QUADAS-2 原著・PRISMA-DTA・Cochrane DTA ハンドブック・尤度比\u002F事前後確率\u002Fスペクトラムバイアスの方法論レビュー\u003C\u002Fstrong>を一次資料として取得し中核をさらに固める。耳鼻咽喉科の診断検査（聴力・前庭機能・画像・病理）に即した精度研究事例も将来上乗せ。\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Ch2 id=\"sec-3\">精度指標（confidence:high — 方法論の定義）\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>\u003Cstrong>感度・特異度\u003C\u002Fstrong>: 参照標準を真として、疾患ありを陽性とする割合（感度）／疾患なしを陰性とする割合（特異度）。2×2表（TP\u002FFP\u002FFN\u002FTN）から算出 \u003Cbutton class=\"pmid-ref\" data-pmid=\"37925910\">PMID:37925910\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>尤度比(LR)・診断オッズ比(DOR)\u003C\u002Fstrong>: 事前確率（有病率）と組み合わせて事後確率を解釈する。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>AUC\u003C\u002Fstrong>: ROC曲線下面積。予測モデルでは識別能の指標。ただしAUC単独では較正(calibration)を評価できず、高AUCでも外部検証なしでは過学習を疑う \u003Cbutton class=\"pmid-ref\" data-pmid=\"35699441\">PMID:35699441\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>的中率(PPV\u002FNPV)は有病率依存\u003C\u002Fstrong>: 感度・特異度が一定でも、有病率（事前確率）が変われば的中率は変動する。スクリーニング検査ではNPVの高さが適性の鍵となる（POC機器GazelleはNPV&gt;98%でスクリーニング適格、確定はHPLC\u002FCZEで行う二段構え）\u003Cbutton class=\"pmid-ref\" data-pmid=\"39513207\">PMID:39513207\u003C\u002Fbutton>。設計段階で\u003Cstrong>有病率をサンプルサイズ計算に組み込む\u003C\u002Fstrong>（Buderer法）のが正攻法 \u003Cbutton class=\"pmid-ref\" data-pmid=\"39513207\">PMID:39513207\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>妥当性(validity)と信頼性(reliability)は別軸\u003C\u002Fstrong>: 感度・特異度（診断精度）だけが検査の評価軸ではない。validity＝gold standardとの一致（基準関連妥当性。相関係数・平均差で評価）、reliability＝観察者内\u002F観察者間の再現性。検査の測定特性はこの両者を分けて評価する \u003Cbutton class=\"pmid-ref\" data-pmid=\"38831134\">PMID:38831134\u003C\u002Fbutton>。検査の精度は用途依存で、日常評価に十分でも手術計画には不十分という結論もありうる \u003Cbutton class=\"pmid-ref\" data-pmid=\"38831134\">PMID:38831134\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>感度・特異度は対象集団の有病率・重症度分布（スペクトラム）に依存して変動するため、適用集団が研究集団と異なると外的妥当性が崩れる。低フェリチンがHbA2産生を抑え偽陰性を招くといった、検査結果に影響する集団特性はサブ群層別で検証するのが望ましい \u003Cbutton class=\"pmid-ref\" data-pmid=\"39513207\">PMID:39513207\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Ch2 id=\"sec-4\">報告ガイドライン STARD 2015 \u002F STARD-AI（confidence:high）\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>STARD（Standards for Reporting of Diagnostic Accuracy）は、対象集団・index test・参照標準・flow &amp; timing 等の報告完全性を担保するチェックリスト。報告が不完全だと読者はバイアス検出・一般化可能性の判断・追試ができない \u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37541083\">PMID:37541083\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>STARD-AI（2025）\u003C\u002Fstrong>: AIを index test とする診断精度研究には固有の論点があるため、STARD 2015 に\u003Cstrong>新規\u002F改変18項目\u003C\u002Fstrong>を加えた拡張版が策定された（240名超の修正Delphi合意）。著者は特に \u003Cstrong>(1)データセットの取り扱い、(2)AI index test とその評価方法、(3)アルゴリズムのバイアスと公平性(algorithmic bias &amp; fairness)\u003C\u002Fstrong> の記述を推奨。読者がAI診断研究のバイアス・適用可能性・一般化可能性を評価できるようにする狙い \u003Cbutton class=\"pmid-ref\" data-pmid=\"40954311\">PMID:40954311\u003C\u002Fbutton>（※18項目の各内容は全文未取得・暫定）。AI診断研究のRoB評価には PROBAST(-AI) が補完的に必要で、STARD-AI単独では研究の質は保証されない点に注意。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>遵守は領域を問わず moderate にとどまる\u003C\u002Fstrong>: 急性期POCUS 66%(19.7\u002F30) \u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>、脳動脈瘤画像 71%(24.2\u002F34) \u003Cbutton class=\"pmid-ref\" data-pmid=\"37541083\">PMID:37541083\u003C\u002Fbutton>、HCCのmiRNA 52.6%(12.1\u002F23) \u003Cbutton class=\"pmid-ref\" data-pmid=\"40481407\">PMID:40481407\u003C\u002Fbutton>。画像領域より新規バイオマーカー領域で低い傾向。\n\u003Cul>\n\u003Cli>※領域間で数値を比較する際は\u003Cstrong>分母（30項目 vs 34項目=subitem含む）の違い\u003C\u002Fstrong>に注意する \u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37541083\">PMID:37541083\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003C\u002Ful>\n\u003C\u002Fli>\n\u003Cli>\u003Cstrong>落ちやすい＝バイアスに直結する項目\u003C\u002Fstrong>: 連続\u002F便宜\u002Fランダム抽出の別、独立 vs 合議読影、臨床情報や参照標準への盲検化、異質性分析、不確定・欠測データ、index\u002Freference間の時間間隔。これらが未報告の論文は精度が過大評価されている可能性を割り引いて読む \u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>STARD公表だけでは報告質は改善しない\u003C\u002Fstrong>: HCC miRNA研究では STARD 2015 公表後も遵守は有意に向上せず \u003Cbutton class=\"pmid-ref\" data-pmid=\"40481407\">PMID:40481407\u003C\u002Fbutton>。一方、STARDを引用した研究・STARD採用誌の研究では遵守が有意に高い \u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>。改善には投稿規定での義務化が有効と複数SRが提言 \u003Cbutton class=\"pmid-ref\" data-pmid=\"37541083\">PMID:37541083\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>IF・デザインと報告質は無関係\u003C\u002Fstrong>: 高IF誌＝報告が良い、前向き＝報告が良い、とは限らない（POCUS SRで有意差なし）\u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Ch2 id=\"sec-5\">バイアス評価 QUADAS-2（confidence:medium）\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>QUADAS-2 は4領域（患者選択・index test・参照標準・flow &amp; timing）でRoBと適用可能性を評価する。診断精度MAでの標準的吟味ツール \u003Cbutton class=\"pmid-ref\" data-pmid=\"37925910\">PMID:37925910\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37885475\">PMID:37885475\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>患者選択（症例対照デザイン）\u003C\u002Fstrong>: 症例対照は明確な疾患群と健常群を選ぶためスペクトラムバイアスを招き、感度・特異度を系統的に膨らませる。AI-ACSのDTA MAでは症例対照混入がエビデンス質をlowに引き下げた主因 \u003Cbutton class=\"pmid-ref\" data-pmid=\"37925910\">PMID:37925910\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>参照標準と co-registration\u003C\u002Fstrong>: 参照標準が妥当で、index画像と参照画像が同一座標系に整合(co-registration)されているかが精度推定の前提 \u003Cbutton class=\"pmid-ref\" data-pmid=\"37885475\">PMID:37885475\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>検証(verification)バイアス\u003C\u002Fstrong>: 患者選別フローチャートの欠如・連続登録の不記載は検証バイアスを招き、偽陰性\u002F偽陽性を見落とす \u003Cbutton class=\"pmid-ref\" data-pmid=\"40481407\">PMID:40481407\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>盲検化の欠如\u003C\u002Fstrong>: index\u002F参照標準・臨床情報への非盲検判定は期待バイアスを生む \u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40481407\">PMID:40481407\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>判定の運用\u003C\u002Fstrong>: QUADAS-2\u002FSTARDは各基準を positive(低RoB)\u002Fnegative(高RoB)\u002Funclear(情報不足) または yes\u002Fno\u002Funclear で二名独立評価し、不一致は第三者で解決するのが標準。POC検査SRでは、データベース由来データ・複数評価者・既往症患者の混入を理由に\u003Cstrong>患者選択領域を高RoB\u003C\u002Fstrong>と判定した好例がある \u003Cbutton class=\"pmid-ref\" data-pmid=\"40842435\">PMID:40842435\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"38831134\">PMID:38831134\u003C\u002Fbutton>。連続抽出(consecutive sampling)は患者選択RoB・スペクトラムバイアスを下げる設計上の正攻法 \u003Cbutton class=\"pmid-ref\" data-pmid=\"39513207\">PMID:39513207\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Ch2 id=\"sec-6\">診断精度メタ解析（confidence:medium）\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>診断精度MAは \u003Cstrong>PRISMA-DTA\u003C\u002Fstrong> に従い報告する \u003Cbutton class=\"pmid-ref\" data-pmid=\"37885475\">PMID:37885475\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"35699441\">PMID:35699441\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>感度・特異度は負の相関を持つため単純プールは不適で、\u003Cstrong>bivariate \u002F HSROC（階層的SROC）モデル\u003C\u002Fstrong>で要約感度・特異度・SROC曲線を推定する \u003Cbutton class=\"pmid-ref\" data-pmid=\"37925910\">PMID:37925910\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>閾値効果と異質性\u003C\u002Fstrong>: index testのカットオフが研究間で大きく変動すると（閾値効果）、ポイント推定の統合は意味をなさない。CTPのSRでは閾値・デザインの著明な異質性とデータ不足のため\u003Cstrong>メタ解析自体が実行不能\u003C\u002Fstrong>となり、無理にプールせず記述統合に留めた（negative-methodologyの好例）\u003Cbutton class=\"pmid-ref\" data-pmid=\"37885475\">PMID:37885475\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>SRでは\u003Cstrong>同一グループによる患者重複の重複報告バイアス\u003C\u002Fstrong>にも対処が必要（原則1回計上）\u003Cbutton class=\"pmid-ref\" data-pmid=\"37885475\">PMID:37885475\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>2×2表の実務\u003C\u002Fstrong>: 各組入れ研究で2×2表(TP\u002FFP\u002FFN\u002FTN)を作り、感度・特異度・尤度比・的中率を算出する。ゼロセルがあると計算不能になるため\u003Cstrong>連続性補正(+0.5や+1)\u003C\u002Fstrong>を付与する（あるSRでは0セルに+1を付与、該当は1試験のみ）\u003Cbutton class=\"pmid-ref\" data-pmid=\"40842435\">PMID:40842435\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>\u003Cstrong>単純平均統合の限界\u003C\u002Fstrong>: 感度・特異度を各研究で単純平均＋SDするだけの統合は、両指標の負の相関や閾値効果を扱えず、要約推定値・SROC曲線・I²が得られない。bivariate\u002FHSROCを用いない統合は方法論的に弱い（\u003Cbutton class=\"pmid-ref\" data-pmid=\"40842435\">PMID:40842435\u003C\u002Fbutton>はこの弱点を持つ反面教師）。また異質性が大きい場合はメタ解析を強行せず\u003Cstrong>記述統合\u003C\u002Fstrong>に留めるのが正しい判断 \u003Cbutton class=\"pmid-ref\" data-pmid=\"37885475\">PMID:37885475\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"38831134\">PMID:38831134\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Ch2 id=\"sec-7\">AI・予測モデル型診断精度の課題（confidence:medium）\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>AI診断ツールの高い感度・特異度は、組入れ研究のデザイン（症例対照偏重）により過大評価されやすい。質改善には\u003Cstrong>STARD-AI遵守\u003C\u002Fstrong>とコホート研究の蓄積が前提 \u003Cbutton class=\"pmid-ref\" data-pmid=\"37925910\">PMID:37925910\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40954311\">PMID:40954311\u003C\u002Fbutton>。STARD-AIはデータセットの取り扱い・AI index testの評価方法・アルゴリズムのバイアス\u002F公平性の報告を求め、AI固有の論点を可視化する \u003Cbutton class=\"pmid-ref\" data-pmid=\"40954311\">PMID:40954311\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>複数変数を組み合わせた予測モデル\u002Fスコアは高AUCを出しやすいが、\u003Cstrong>内部検証（ブートストラップ・k-fold交差検証）だけでは不十分\u003C\u002Fstrong>で、独立サンプルでの\u003Cstrong>外部検証\u003C\u002Fstrong>が臨床導入の前提。SARS-CoV-2診断戦略SRでは外部検証は23件中7件(30%)のみ \u003Cbutton class=\"pmid-ref\" data-pmid=\"35699441\">PMID:35699441\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>予測モデルの評価には本来 \u003Cstrong>TRIPOD（報告）・PROBAST（RoB）\u003C\u002Fstrong> が適切で、STARDは部分的にしか適合しない。AUCのみで較正(calibration)評価が落ちやすい点に注意 \u003Cbutton class=\"pmid-ref\" data-pmid=\"35699441\">PMID:35699441\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Ch2 id=\"sec-8\">事例（参考：領域外・狭い／旧背骨）（※全文未取得・暫定）\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>ALS疑い例で \u003Cstrong>Gold Coast基準(GCC)\u003C\u002Fstrong> は高感度(約95%)・低特異度(66%)、rEEC・Awaji基準は高特異度・低感度。GCCはAUC 0.95・DOR 36.1 \u003Cbutton class=\"pmid-ref\" data-pmid=\"40975951\">PMID:40975951\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003Cli>教訓: 組入れ研究がすべてALS紹介センター由来で\u003Cstrong>スペクトラムバイアス\u003C\u002Fstrong>が強く、非選択集団への外的妥当性は不確実。診断精度MAではQUADAS-2「患者選択」を必ず確認すべき好例 \u003Cbutton class=\"pmid-ref\" data-pmid=\"40975951\">PMID:40975951\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Ch2 id=\"sec-9\">最新トピック \u002F 未解決の論点\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>STARD・QUADAS-2・PRISMA-DTA・TRIPOD\u002FPROBAST 等の\u003Cstrong>一次方法論文献（原著）\u003C\u002Fstrong>は未取得。次回優先で取得し定義の根拠を一次資料で固める。\u003C\u002Fli>\n\u003Cli>耳鼻咽喉科領域（聴力・前庭・画像・病理）の診断精度研究事例の上乗せが未着手。\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Ch2 id=\"sec-10\">関連トピック\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>\u003Ca href=\"\u002Ftopic\u002Fguideline-development-grade\">診療ガイドライン作成（GRADE）\u003C\u002Fa> — 診療ガイドライン作成とGRADE。診断精度エビデンスの確実性評価・推奨への反映\u003C\u002Fli>\n\u003Cli>\u003Ca href=\"\u002Ftopic\u002Fpatient-reported-outcomes-ent\">患者報告アウトカム（PRO）とQOL尺度\u003C\u002Fa> — 患者報告アウトカム。測定特性（妥当性・信頼性）評価の方法論と隣接\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Chr>\n\u003Ch2 id=\"sec-11\">更新履歴\u003C\u002Fh2>\n\u003Cul>\n\u003Cli>2026-06-04: 差分精読4本反映（採用4・却下1）。\u003Cstrong>STARD-AI(2025)報告ガイドライン\u003C\u002Fstrong>（STARD2015+18項目、データセット\u002FAI index test\u002Falgorithmic bias）\u003Cbutton class=\"pmid-ref\" data-pmid=\"40954311\">PMID:40954311\u003C\u002Fbutton>、妥当性validity・信頼性reliabilityの測定特性評価SR \u003Cbutton class=\"pmid-ref\" data-pmid=\"38831134\">PMID:38831134\u003C\u002Fbutton>、STARD+QUADAS-2でのPOC検査精度比較SR・2×2表\u002F連続性補正\u002F単純平均統合の限界 \u003Cbutton class=\"pmid-ref\" data-pmid=\"40842435\">PMID:40842435\u003C\u002Fbutton>、STARD準拠の前向き診断精度研究（連続抽出・Buderer法サンプルサイズ・NPV\u002Fサブ群）\u003Cbutton class=\"pmid-ref\" data-pmid=\"39513207\">PMID:39513207\u003C\u002Fbutton> を追加。後3者は非ENT題材の方法論サンプル（confidence:low）。却下: \u003Cbutton class=\"pmid-ref\" data-pmid=\"41346991\">PMID:41346991\u003C\u002Fbutton>（膝OAへのLLM応用SR — 診断精度の方法論が中核でなくLLM臨床応用全般・特定疾患に偏る、STARD-AIで方法論は充足）。paper_count 7→11。\u003C\u002Fli>\n\u003Cli>2026-06-03: 差分精読6本反映（採用6・却下0）。STARD遵守の領域横断知見（POCUS66%\u002F画像71%\u002FmiRNA52.6%、公表後も非改善・IF\u002Fデザイン無関係・落ちやすい項目）\u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40481407\">PMID:40481407\u003C\u002Fbutton>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37541083\">PMID:37541083\u003C\u002Fbutton>、QUADAS-2\u002FHSROC\u002F症例対照過大評価 \u003Cbutton class=\"pmid-ref\" data-pmid=\"37925910\">PMID:37925910\u003C\u002Fbutton>、閾値効果でメタ解析不能・参照標準co-registration \u003Cbutton class=\"pmid-ref\" data-pmid=\"37885475\">PMID:37885475\u003C\u002Fbutton>、内部 vs 外部検証・TRIPOD\u002FPROBAST \u003Cbutton class=\"pmid-ref\" data-pmid=\"35699441\">PMID:35699441\u003C\u002Fbutton> を追加。\u003Cstrong>アンカーを領域外ALS事例\u003Cbutton class=\"pmid-ref\" data-pmid=\"40975951\">PMID:40975951\u003C\u002Fbutton>から方法論SR\u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton>へ変更\u003C\u002Fstrong>。paper_count 1→7。\u003C\u002Fli>\n\u003Cli>2026-06-01: 初版作成（abstract-only 暫定）。診断精度MAの一事例（ALS Gold Coast基準, 領域外・狭い）を暫定背骨として反映 \u003Cbutton class=\"pmid-ref\" data-pmid=\"40975951\">PMID:40975951\u003C\u002Fbutton>。\u003C\u002Fli>\n\u003C\u002Ful>\n\u003Ch2 id=\"sec-12\">参照論文\u003C\u002Fh2>\n\u003Col>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"32356885\">PMID:32356885\u003C\u002Fbutton> — アンカー: 急性期POCUS診断精度研究74件のSTARD 2015遵守は66%(19.7\u002F30)。盲検化・異質性分析等のバイアス直結項目が落ちやすい。STARD採用誌\u002F引用で遵守↑、IF\u002Fデザインは無関係 (Prager 2020, JAMA Netw Open \u002F sr-ma \u002F Lv.1 \u002F RoB:low \u002F confidence:high \u002F full-text)\u003C\u002Fli>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40481407\">PMID:40481407\u003C\u002Fbutton> — HCCのmiRNA診断精度研究62件のSTARD遵守は52.6%(12.1\u002F23)、STARD2015公表後も非改善。検証バイアス・カットオフ不透明が精度過大評価を招く (Wang 2025, BMC Med Res Methodol \u002F sr-ma \u002F Lv.1 \u002F RoB:low \u002F confidence:high \u002F full-text)\u003C\u002Fli>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37541083\">PMID:37541083\u003C\u002Fbutton> — 脳動脈瘤画像診断精度研究66件のSTARD遵守は71%(24.2\u002F34, 分母34)。義務化を提言 (Phua 2023, J Clin Neurosci \u002F sr-ma \u002F Lv.1 \u002F RoB:some-concerns \u002F confidence:medium \u002F 暫定)\u003C\u002Fli>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37925910\">PMID:37925910\u003C\u002Fbutton> — AI支援ACS検出のDTA MA(66件\u002F52万人)。QUADAS-2+HSROCで統合、症例対照混入で質low。STARD遵守とコホート増を提言 (Chan 2023, Comput Biol Med \u002F sr-ma \u002F Lv.1 \u002F RoB:high \u002F confidence:medium \u002F 暫定)\u003C\u002Fli>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"37885475\">PMID:37885475\u003C\u002Fbutton> — CTPの診断精度SR(24件)。閾値・デザインの異質性でメタ解析不能、単一閾値一律適用の限界、参照標準co-registrationの重要性 (Thirugnanachandran 2023, Front Neurol \u002F sr-ma \u002F Lv.1 \u002F RoB:some-concerns \u002F confidence:medium \u002F full-text)\u003C\u002Fli>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"35699441\">PMID:35699441\u003C\u002Fbutton> — SARS-CoV-2診断戦略SR(23件)。複数変数で高AUCも外部検証は30%のみ。内部 vs 外部検証、予測モデルにはTRIPOD\u002FPROBAST (Cremades-Martínez 2022, Microbiol Spectr \u002F sr-ma \u002F Lv.1 \u002F RoB:some-concerns \u002F confidence:medium \u002F full-text)\u003C\u002Fli>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40975951\">PMID:40975951\u003C\u002Fbutton> — 参考(領域外・狭い): ALS診断のGold Coast基準は高感度・低特異度。スペクトラムバイアス・QUADAS-2の一事例 (von Quednow 2025, Clin Neurophysiol \u002F sr-ma \u002F Lv.1 \u002F RoB:some-concerns \u002F confidence:medium \u002F 暫定)\u003C\u002Fli>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40954311\">PMID:40954311\u003C\u002Fbutton> — STARD-AI報告ガイドライン。STARD2015に新規\u002F改変18項目追加（データセット\u002FAI index test\u002Falgorithmic bias &amp; fairness）、240名超のDelphi合意 (Sounderajah 2025, Nature Medicine \u002F guideline \u002F Lv.5 \u002F RoB:n\u002Fa \u002F confidence:high \u002F 暫定[非OA])\u003C\u002Fli>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"38831134\">PMID:38831134\u003C\u002Fbutton> — 方法論サンプル(非ENT): 超音波下肢捻転評価の妥当性validity・信頼性reliabilityのSR。STARD+QUADASで質評価、validity(相関0.57–0.88)とreliabilityを分離、異質性大で記述統合 (Ruiz-Tarrazo 2024, Eur J Pediatr \u002F sr-ma \u002F Lv.1 \u002F RoB:some-concerns \u002F confidence:low \u002F full-text)\u003C\u002Fli>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"40842435\">PMID:40842435\u003C\u002Fbutton> — 方法論サンプル(非ENT): デングRDT vs TTのDA SR(23件)。STARD+QUADAS-2、2×2表\u002F尤度比\u002F連続性補正(+1)、患者選択で高RoB、単純平均統合の限界 (Baje 2025, Epidemiol Infect \u002F sr-ma \u002F Lv.1 \u002F RoB:high \u002F confidence:low \u002F full-text)\u003C\u002Fli>\n\u003Cli>\u003Cbutton class=\"pmid-ref\" data-pmid=\"39513207\">PMID:39513207\u003C\u002Fbutton> — 方法論サンプル(非ENT): POC機器GazelleのDA研究(446名)。STARD準拠・連続抽出・Buderer法サンプルサイズ・フェリチン層別・NPV&gt;98%(スクリーニング適格) (Singh 2024, Indian J Med Res \u002F diagnostic-accuracy \u002F Lv.2 \u002F RoB:low \u002F confidence:low \u002F full-text)\u003C\u002Fli>\n\u003C\u002Fol>\n",[25,29,32,35,38,41,44,47,50,53,56,59],{"id":26,"text":27,"level":28},"sec-1","サマリ（現時点の到達点）",2,{"id":30,"text":31,"level":28},"sec-2","カバレッジ（この知識の確からしさ範囲）",{"id":33,"text":34,"level":28},"sec-3","精度指標（confidence:high — 方法論の定義）",{"id":36,"text":37,"level":28},"sec-4","報告ガイドライン STARD 2015 \u002F STARD-AI（confidence:high）",{"id":39,"text":40,"level":28},"sec-5","バイアス評価 QUADAS-2（confidence:medium）",{"id":42,"text":43,"level":28},"sec-6","診断精度メタ解析（confidence:medium）",{"id":45,"text":46,"level":28},"sec-7","AI・予測モデル型診断精度の課題（confidence:medium）",{"id":48,"text":49,"level":28},"sec-8","事例（参考：領域外・狭い／旧背骨）（※全文未取得・暫定）",{"id":51,"text":52,"level":28},"sec-9","最新トピック \u002F 未解決の論点",{"id":54,"text":55,"level":28},"sec-10","関連トピック",{"id":57,"text":58,"level":28},"sec-11","更新履歴",{"id":60,"text":61,"level":28},"sec-12","参照論文",[63,64,65,66,67,68,69,70,71,72,73,74],"32356885","40481407","37541083","37925910","37885475","35699441","40975951","40954311","38831134","40842435","39513207","41346991",1780636662342]