診療ガイドライン作成(GRADE)(Clinical Practice Guideline Development — GRADE)
⚠️ 医療者向け研究レビュー。診療判断・医学的助言ではない。最終判断は一次資料と専門家の評価による。 最終更新: 2026-06-03 / 反映論文: 4件(暫定背骨1+GRADE実装GL3例を全文精読) / GRADE方法論総論の中核背骨は未取得(実装例で暫定補強) / 未レビュー
サマリ(現時点の到達点・暫定)
本トピックは「診療ガイドラインをどう作り・どう評価するか」(PICO設定、システマティックレビューによる根拠統合、GRADEによるエビデンス総体の確実性評価=高/中/低/非常に低、推奨の方向と強さ、Evidence-to-Decision枠組み、報告ガイドラインRIGHT、ガイドライン評価ツールAGREE II、利益相反管理など)の方法論総論を扱う。 ただし現時点の背骨(anchor)は成人肥満症の薬物療法の診療ガイドライン更新であり、方法論総論そのものではない。加えて同ガイドラインは評価・推奨形成にGRADEではなくShekelle枠組みを用いており、GRADEの代表例としても枠組みが一致しない。GRADE/Evidence-to-Decision/AGREE II の枠組み自体を解説する中核レビュー・方法論論文は未取得(※全文未取得・暫定)。
カバレッジ(この知識の確からしさ範囲)
- 背骨(anchor): — 診療ガイドライン(GL)・2025(CMAJ)。ただし領域外(成人肥満内科の薬物療法)・かつ方法論にGRADEでなくShekelle枠組みを用いた事例であり、診療ガイドライン作成(GRADE)の方法論総論の背骨としては不適合・範囲が狭い。「ガイドライン更新の構造(改訂点の明示・サブ集団別検索・利害関係者関与・COI開示)を読む一事例」として参照するにとどまる。
- GRADE実装例(全文精読・領域外): GRADE/EtD/AGREE-IIを明示的に運用したGL3例を方法論の適用例として上乗せ(いずれも confidence:low、ENT領域外)。①便秘の食事管理GL(SR/MA→GRADE→Delphi、確実性と推奨強さの非対称を実データで提示)、②腹壁切開閉鎖GL(SIGN+GRADE+AGREE-II+EtD、COI回避の手続き)、③重症TBIの神経予後予測GL(GRADEを予測因子に応用、PICOTS拡張、good practice statement)。
- 反映範囲: 背骨は abstract-only 暫定。GRADE実装例3件は full-text 精読だが、いずれもENT領域外であり「GRADE運用のされ方を観察する例」にとどまる。
- 暫定(全文未取得): (note_status=provisional-abstract)。推奨ごとの根拠の質・グレード判定・利益相反管理の方針・GRADE/Shekelleの適用詳細は未確認。
- 飽和目標: GRADE作成の中核資料(GRADEワーキンググループのGRADE handbook・GRADE seriesの方法論論文、Evidence-to-Decision (EtD) frameworks、AGREE II 原著、RIGHT報告チェックリスト、Cochrane/WHOのガイドライン作成マニュアル)を次回優先で取得し、本トピックの中核背骨を別途設定する。耳鼻咽喉科領域の診療ガイドライン(例: 学会GLの作成・評価)の事例も将来上乗せ。
方法論の骨子(※枠組み自体の一次資料=GRADE原著は未取得・暫定。下記は実装GL3例で部分裏付け)
- 報告ガイドライン: 診療ガイドラインの報告は RIGHT チェックリストに従う(※GRADE/RIGHT原著は全文未取得・暫定)。
- 作成プロセス: 臨床疑問のPICO化 → システマティックレビューによる根拠統合 → エビデンス総体の確実性評価 → 推奨の方向と強さの決定(Evidence-to-Decision)。実装例では Key Question を PICO に変換する手順が共通して用いられた 。
- エビデンスの確実性(GRADE): アウトカムごとに高/中/低/非常に低で評価。RCTは「高」、観察研究は「低」から開始し、格下げ5要因(RoB・非一貫性I²・非直接性・不精確・出版バイアス)/観察研究の格上げ3要因(大きな効果・量反応・交絡が効果を弱める)で調整する(rubric §5 と整合)(※GRADE原著は全文未取得・暫定)。実装例では、ある推奨が「high risk of bias・inconsistency・imprecision で格下げ→low」だが「用量反応で格上げ」と、格下げ/格上げ要因が併用された記述が確認できる 。1推奨に複数アウトカムが寄与する場合は最も低い確実性を採用する運用も明示された 。
- 推奨の強さ: 「強い/弱い(条件付き)」。確実性に加え、益と害のバランス・患者の価値観や好み・資源(コスト)・受容性・実行可能性をEtDで勘案する(※GRADE原著は全文未取得・暫定)。確実性と強さは独立で、「low evidence だが strong recommendation」が成立しうる(適用性・益>害・効果量・低コスト等を勘案)——実データでも 59推奨中 very low=12/low=39/moderate=8/high=0 に対し strong=27 が存在した 。
- EtDの構成要素: GRADEを予測因子に応用したGLでは、①エビデンスの質・②アウトカムの望ましさ・③価値観と好み・④資源利用の4基準に焦点を当て、EtD的な意思決定を行った 。エビデンス評価になじまない基本原則は推奨と分けて good practice statement として起草する運用も見られた 。
- 個別研究の吟味とエビデンス総体の評価は別ツール: 個々のSR/RCT/コホートは SIGN instrument 等で吟味し、エビデンス総体の確実性を GRADE で評価する二層構造が用いられた 。
- ガイドライン評価ツール: AGREE II の6領域(適用範囲と目的・利害関係者の関与・作成の厳密性・提示の明確性・適用可能性・編集の独立性/利益相反)で評価する(rubric §3/§4)。実装例でも AGREE instrument に準拠したと明記された (※AGREE II原著は全文未取得・暫定)。
事例(背骨:領域外・狭い)(※全文未取得・暫定)
- 成人肥満症の薬物療法に関する2025年カナダ診療ガイドライン更新は、2020/2022版を引き継ぎ新規6件+改訂7件の推奨を追加。系統的文献レビュー(2022年1月〜2024年7月、2025年5月までの試験で補完)+13サブ集団の的を絞った検索を実施し、プライマリケア医・肥満医療専門医・当事者のフィードバックを反映した 。
- 教訓(方法論的読み筋): ①改訂点(新規/改訂の件数)を明示し前版との差分を追える構造、②サブ集団別に検索を分ける設計、③利害関係者(当事者含む)の関与は AGREE II「利害関係者の関与」を満たす好例。一方で著者の広範な製薬企業COIは AGREE II「編集の独立性」で要注意——ガイドラインを読む際はCOI管理方針を必ず確認すべき好例 。
- 注意: 同ガイドラインはGRADEでなくShekelle枠組みを採用しており、GRADEの確実性評価・EtDの代表例としては使えない(枠組み不一致)。
GRADE実装例(全文精読・領域外。confidence:low)
GRADE方法論総論の一次資料は未取得だが、GRADEを実際に運用したGL3例を全文精読し、「GRADEがどう使われるか」を観察した。いずれもENT領域外のため、方法論の読み筋としてのみ参照する。
① 確実性と推奨強さの非対称・Delphi合意(便秘食事管理GL)
- パイプライン: 4本のSR/MA(計75 RCT)→ GRADE → 修正Delphi。メタ解析に2本以上のRCTが寄与した知見のみを推奨の根拠とした。
- GRADEの核心の実証: エビデンスの確実性(high/moderate/low/very low)と推奨の強さ(strong/qualified)は独立。実データで low evidence でも strong recommendation が成立しうることを示す(59推奨中 strong=27, qualified=32/確実性は moderate=8 が上限で high=0)。
- 複数アウトカムの統合: 1推奨に複数アウトカムが寄与する場合、最も低い確実性を全体評価に採用。
- 合意形成: Guideline Steering Committee の修正Delphiで85%以上の合意を採択基準とし、未達は再起草・再投票。
- 教訓: 「エビデンスが弱い=弱い推奨」ではない。GRADEは益害・価値観・コスト・適用性を統合して強さを決める。
② 二層の吟味+EtD+COI回避手続き(腹壁切開閉鎖GL)
- 二層構造: 個別研究は SIGN instrument、エビデンス総体は GRADE。ガイドライン枠組みは AGREE に準拠。
- KQ→PICO: Key Question を PICO に変換し、緊急手術等は別途検索を分けた。
- EtD・合意閾値: サブグループが Evidence-to-Decision framework 内で推奨案を提示、75%以上の合意で確定。
- COI回避(手続き的): 自身が著者/共著者の論文は評価担当から外す。AGREE-II「編集の独立性」の実装として参考。
③ GRADEの予測因子への応用・PICOTS・good practice statement(重症TBI神経予後予測GL)
- 非介入領域への応用: GRADEを治療介入でなく予測因子・予測モデルの信頼性評価に適用。
- PICOTS: 通常のPICOに timing・setting を加えた枠組みで臨床疑問を定義。
- 4つのGRADE基準: 質・アウトカムの望ましさ・価値観と好み・資源利用に焦点(EtDの構成要素に対応)。
- good practice statement: 形式的なエビデンス評価になじまない基本原則は推奨と分離して起草。
パネル構成・利益相反(COI)管理(実装例から)(confidence:low)
- 多職種パネル: 臨床専門医に加え、生物医学情報専門家・認定ガイドライン方法論家・患者代表を含む構成が AGREE-II「利害関係者の関与」を満たす好例 。
- COIの手続き的管理: 自著論文を評価から外す運用 。一方、食品/サプリ企業からの助成・講演料を多数開示する事例もあり、ガイドラインを読む際は COI管理方針を必ず確認すべき(AGREE-II「編集の独立性」)。
最新トピック / 未解決の論点
- 本トピックはGRADE方法論総論の中核背骨が未取得のため全体像は未確定(暫定)。現背骨は領域外(肥満内科)・かつ枠組み不一致(Shekelle)の一事例にすぎない。
- 次回: GRADE handbook・GRADE series・Evidence-to-Decision frameworks・AGREE II・RIGHT 等の方法論一次資料を取得し中核背骨を確立する。
関連トピック
- 外科RCTのデザイン — 外科RCTのデザイン。RCTはGRADEで「高」から開始する根拠であり、推奨の根拠となる一次研究の方法論
- 診断精度研究の方法論 — 診断精度研究の方法論。診断検査エビデンスの確実性評価・推奨への反映と隣接
- 患者報告アウトカム(PRO)とQOL尺度 — 患者報告アウトカム。GRADE/EtDで重視する「患者にとって重要なアウトカム」の測定方法論
更新履歴
- 2026-06-03: 差分精読 第49波。GRADE/EtD/AGREE-IIを明示的に実装したGL3例を全文精読し「GRADE実装例」「方法論の骨子」「パネル構成・COI」節を充実(いずれもENT領域外・confidence:low): 便秘食事管理GL(確実性と推奨強さの非対称・Delphi合意)、腹壁切開閉鎖GL(SIGN+GRADE+AGREE-II+EtD・COI回避手続き)、重症TBI神経予後予測GL(GRADEの予測因子応用・PICOTS・good practice statement)。paper_count 1→4。候補のADA Standards of Care 3件(//)はアブストラクトが定型文でGRADE方法論の記述がなく、糖尿病の臨床推奨そのもので方法論寄与が薄いためscope外として却下。GRADE方法論総論の中核背骨(GRADE handbook/EtD原著/AGREE II原著/RIGHT)は依然未取得、次回優先。
- 2026-06-01: 初版作成(abstract-only 暫定)。診療ガイドライン更新の構造の一事例(成人肥満薬物療法GL, 領域外・Shekelle枠組み・狭い)を暫定背骨として反映 。GRADE方法論総論(GRADE handbook/EtD/AGREE II/RIGHT)の中核資料取得を次回優先。
参照論文
- — 更新(領域外・狭い): 成人肥満薬物療法の2025年GL更新。診療ガイドライン更新の構造(改訂点明示・サブ集団別検索・利害関係者関与・COI)を読む一事例 (Pedersen 2025, CMAJ / guideline / Lv.1 / RoB:n/a / confidence:medium / 暫定)
- — GRADE実装例(領域外・全文精読): 便秘食事管理GL。SR/MA→GRADE→Delphi。確実性と推奨強さの非対称(low evidence でも strong)を実データで提示。COI開示の好例 (Dimidi 2025, J Hum Nutr Diet / guideline / Lv.1 / AGREE-II / confidence:low / full-text)
- — GRADE実装例(領域外・全文精読): 腹壁切開閉鎖GL。SIGN+GRADE+AGREE-II+EtD、KQ→PICO、75%合意、COI回避手続き(自著論文を評価しない) (Deerenberg 2022, Br J Surg / guideline / Lv.1 / AGREE-II / confidence:low / full-text)
- — GRADE実装例(領域外・全文精読): 重症TBI神経予後予測GL。GRADEを予測因子に応用、PICOTS拡張、4つのGRADE基準、good practice statement (Muehlschlegel 2024, Neurocrit Care / guideline / Lv.1 / AGREE-II / confidence:low / full-text)