ICH E20(臨床試験のためのアダプティブデザイン)とは ― Step 4最終化目前!国際調和ガイドラインの全体像 ―

・ICH E20「臨床試験のためのアダプティブデザイン」ガイドラインの位置づけと現在のステータス(Step 2b 到達 → 2026年 Step 4 最終化予定)
・本ガイドラインが想定する確証的試験向けアダプティブデザインの主要な類型(群逐次・標本サイズ再推定・ポピュレーション選択・反応適合型割付など)
・統計的原則(Type I 誤りの厳格制御・推定バイアス・多重性)と試験運営上の考慮事項(事前規定・盲検性・独立統計解析)
・Rで学ぶ群逐次デザインの中間解析シミュレーション(
gsDesignパッケージ)・既存のFDAガイダンス(2019)・ICH E9 / E9(R1) / E8(R1) との関係と、日本PMDAでの取り扱い
記事の目次
Toggleはじめに
アダプティブデザインは、臨床試験を「柔軟に、しかし統計的に厳密に」実施する方法論として、20年以上にわたり議論が重ねられてきました。しかし、各規制当局(FDA・EMA・PMDA)のガイダンスは内容や立場が微妙に異なり、国際共同治験で一貫したデザインを提案する際にスポンサーと規制当局の双方で悩ましい状況が続いてきました。
この状況を解消するため、ICH(医薬品規制調和国際会議)はE20「Adaptive Designs for Clinical Trials(臨床試験のためのアダプティブデザイン)」の策定に乗り出し、2025年6月25日にStep 2bに到達しました。同年6月30日から11月30日までのパブリックコメント期間(Step 3)は2025年11月末に完了し、現在はStep 4最終化に向けた審議が進んでいます。Step 4の最終合意は2026年10月が目標とされており、グローバル開発に携わる製薬企業にとって、今まさに内容を押さえておくべきタイミングです。
本記事では、製薬企業の生物統計担当者・臨床開発担当者・規制担当者を対象に、ICH E20の全体像・扱う類型・統計原則・実務上の注意点を体系的に整理します。既にFDAガイダンス(2019)を中心にアダプティブデザインを学んだ方にとっても、国際調和文書としてのE20固有の重みを把握しておくことは、今後の国際共同治験設計で極めて重要になります。
ICH E20の背景・目的・現在のステータス
ICH E20は、ICHガイドラインの分類のうちE分野(Efficacy:有効性)に位置づけられる新規ガイドラインです。ICHは新薬承認要件の国際調和を目的に1990年に設立され、E9(臨床試験のための統計的原則・1998)、E9(R1)(Estimandに関する補遺・2019)、E8(R1)(臨床試験の一般指針・2021)、E10(対照群の選択)といったE分野の中核文書が既に整備されています。E20はその蓄積の上に「アダプティブデザインに特化した国際調和の原則」を提供するものです。
| 項目 | 内容 |
|---|---|
| 正式名称 | ICH E20「Adaptive Designs for Clinical Trials(臨床試験のためのアダプティブデザイン)」 |
| Concept Paper | 2019年公表 |
| Step 2b 到達 | 2025年6月25日 |
| パブコメ期間(Step 3) | 2025年6月30日 ~ 2025年11月30日(完了)。日本では2025年10月31日付でPMDA修正版公開 |
| 現在のステータス(2026年4月時点) | Step 3完了・Step 4最終化審議中 |
| Step 4 最終化目標 | 2026年10月予定 |
| 主な対象 | 検証的(confirmatory)臨床試験におけるアダプティブデザイン |
| 主な議論の焦点 | ベイズ流アダプティブデザインの位置づけ、コア原則の明確化 |
ICH E20では、アダプティブデザインを「集積した参加者データの中間解析に基づき、試験のひとつ以上の側面を事前に計画された方法で修正することを許容する臨床試験デザイン」と定義しています。この定義の核心は「事前計画(pre-specified)」です。事後的な修正は恣意的な意思決定を招き、Type I 誤りを膨らませるため、ICH E20では事前規定の重要性が繰り返し強調されています。
ICH E20が扱うアダプティブデザインの主要類型
ICH E20は、過去のFDAガイダンス(2019年最終版)が扱った類型をおおむね継承しつつ、確証的試験への適用可能性という観点で原則ベースでの記述を採用しています。以下の類型が代表的です。
| 類型 | 修正する対象 | 典型的な活用場面 |
|---|---|---|
| 群逐次デザイン(Group Sequential) | 有効中止・無効中止の可否 | 腫瘍・心血管領域の大規模Phase IIIで広く採用 |
| 標本サイズ再推定(SSR) | 試験の目標症例数 | 効果量の事前仮定に不確実性が大きい場合 |
| ポピュレーション選択(Enrichment) | 対象集団(部分集団の選択) | バイオマーカー陽性群に絞り込む場合など |
| 用量選択(Dose Selection) | 継続する用量群 | Phase II/III シームレスデザイン |
| 反応適合型割付(RAR) | 割付確率 | 希少疾患・小児・倫理的要請が強い領域 |
| マスタープロトコル/プラットフォーム試験 | 治療アーム・対照群の追加・終了 | パンデミック対応、がん領域の継続的評価 |
| 連続的再評価法(CRM)など | 用量(早期開発) | First-in-human / MTD 推定 |
Step 2b 草案では、これらの類型に対して「確証的試験に用いる場合に押さえるべき統計的・運営的原則」を横断的に提示しており、個別手法の細部ではなくガバナンスと品質に重点が置かれています。
統計的原則と試験運営上の考慮事項
ICH E20 の肝は、「中間解析に基づき試験を修正する」という柔軟性を、Type I 誤りを厳格に制御したうえで担保することにあります。ここでは統計・運営の両側面から主要原則を整理します。
統計的原則
第一の柱は Type I 誤り(第一種の過誤)の厳密な制御 です。中間解析で有効中止・用量変更・母集団選択などを許容する場合、事前に規定した境界(boundaries)・消費関数(spending function)・検定手順を用いて、片側有意水準 \(\alpha\) の全体管理を保証しなければなりません。群逐次では O’Brien–Fleming 型・Pocock 型境界、SSRでは conditional power や combination test(CHW法など)、ポピュレーション選択では closed testing による多重性調整が典型です。
第二の柱は 推定値のバイアスと信頼区間の妥当性 です。中間で有効中止したような試験では、単純な MLE は効果量を過大評価する傾向があります。ICH E20 はmedian-unbiased estimator や調整済み信頼区間の適用を推奨しており、これは固定デザインでは通常不要だった追加的考慮事項です。
第三の柱は 多重性 です。複数の中間解析、複数のエンドポイント、複数のサブ集団にまたがる検定が組み合わさると、Family-wise error rate(FWER)の設計が複雑化します。事前にグローバルな多重性戦略を文書化することが必要です。
Step 2b 以降の議論で最も焦点化されているのが、ベイズ流アダプティブデザインの確証的試験への適用可否です。事後確率や予測確率に基づく意思決定でも、頻度論的な Type I 誤りの運用特性(operating characteristics)をシミュレーションで提示することが事実上求められる、という方向性が共有されています。ベイズだから多重性を考慮しなくてよい、という誤解は禁物です。
試験運営上の考慮事項
統計的に正しい設計を描いても、運営上の実装が破綻すると試験の信頼性は一気に崩れます。ICH E20 草案が強調する運営原則は次の3点です。
① 事前規定(Pre-specification) すべての意思決定ルール、停止境界、解析手法、再推定式を治験実施計画書(またはアダプティブ計画書)に明記し、必要に応じて統計解析計画書(SAP)・DSMB/IDMC チャーターに接続します。「柔軟性」とは、「事前に規定した中で選択肢がある」ことであり、「現場で何でも変えてよい」ことではありません。② 盲検性の維持 中間解析の結果を試験関係者に漏らすと、選択バイアス・評価バイアスを通じて試験全体の内部妥当性が損なわれます。独立統計解析センター(Independent Statistical Analysis Centre, ISAC)と独立データモニタリング委員会(IDMC/DSMB)の分離、ファイアウォールの設定、結果の伝達範囲の制限が不可欠です。ICH E20 草案ではこの「情報ファイアウォール」に紙幅を多く割いています。③ 規制当局との事前対話 米国では Type C Meeting、日本では対面助言、EUでは Scientific Advice を通じ、アダプティブ計画を実施前に当局と協議することが強く推奨されます。E20 は「事前対話があれば複雑なデザインも検証的試験として受容可能」という国際調和メッセージを明確に打ち出す予定です。
Rで学ぶ:群逐次デザインの中間解析シミュレーション
アダプティブデザインの中で、最も歴史が長く実務でも採用例が多いのが群逐次デザインです。ここでは R の gsDesign パッケージを使い、2回の中間解析 + 最終解析からなる O’Brien–Fleming 型群逐次デザインを設計してみます。
# パッケージの読み込み(未インストールなら install.packages("gsDesign"))library(gsDesign)
# 片側α=0.025、検出力90%、効果量(Z換算)を仮定した
# 3段階群逐次デザイン(2回の中間解析+最終解析)
design <- gsDesign( k = 3, # 解析の総回数(2回中間 + 1回最終) test.type = 1, # 1 = 片側有効性のみ alpha = 0.025, # 片側α beta = 0.10, # 1 - 検出力 = 0.10 sfu = sfLDOF, # Lan-DeMets O'Brien-Fleming型の消費関数 timing = c(1/3, 2/3) # 情報時点:試験の1/3、2/3で中間解析)
# 結果のサマリ表示
summary(design)
print(design)
出力結果(主要な抜粋)は次のようになります。
> print(design)
Asymmetric two-sided group sequential design with90 % power and 2.5 % Type I Error.Upper bounds computed using Lan-DeMets spending function with O'Brien-Fleming approximation. Sample Size ----Lower bounds---- ----Upper bounds---- Analysis Ratio* Z Nominal p Spend Z Nominal p Spend 1 0.3509 --- --- --- 3.71 0.0001 0.0001 2 0.7019 --- --- --- 2.51 0.0060 0.0060 3 1.0528 --- --- --- 1.99 0.0233 0.0189 Total 0.0250 ++ Sample size ratio compared to fixed design with no interim・中間解析1回目(情報35%時点)では Z > 3.71(名目 p < 0.0001)でなければ有効中止しません。極めて強い証拠を要求することで、早期のαの浪費を防いでいます。
・中間解析2回目(情報70%時点)では Z > 2.51(名目 p < 0.006)と基準が緩和されます。
・最終解析では Z > 1.99(名目 p < 0.0233)で棄却。累積のαは0.025に保たれており、片側全体のType I誤りが厳格に制御されています。
・必要症例数の比率は固定デザイン比で約1.053倍となり、中間解析による早期終了オプションを得る「保険料」として約5%の症例増で済むことがわかります。
このように、gsDesign パッケージを使えば、境界値・名目p値・αの消費・固定デザイン比の症例数比率が一括で得られます。実際の申請資料では、この設計をシミュレーションで検証し、operating characteristics(期待症例数、期待試験期間、検出力の感度分析)を添付することが求められます。
既存ガイダンスとの関係・日本PMDAでの取り扱い
ICH E20 は既存のアダプティブデザイン関連文書を置き換えるのではなく、国際調和の「原則」層を提供するものです。関係を整理します。
| ガイドライン | 位置づけ | E20との関係 |
|---|---|---|
| ICH E9(1998) | 臨床試験の統計的原則 | E20 はアダプティブ文脈での E9 の具体化 |
| ICH E9(R1)(2019) | Estimand と感度分析 | 中間で集団が変わる設計では Estimand の整合が論点 |
| ICH E8(R1)(2021) | 臨床試験の一般指針 | Quality by Design 原則に沿った事前計画 |
| FDA Adaptive Designs Guidance(2019) | 米国向け具体ガイダンス | Step 5 後は E20 の原則と整合させる方向で運用 |
| EMA Reflection Paper(2007) | EU向け考え方の整理 | 同上 |
日本では、PMDAが窓口となりパブリックコメントを取りまとめ、2025年10月31日に修正版がe-Govを通じて公開されました。Step 4 最終合意後は厚生労働省通知として国内実装されることになり、2027年前後から国内治験相談でもE20を前提とした議論が標準化する見込みです。特にアカデミア主導の医師主導治験や先駆的医薬品指定制度のもとで、柔軟な試験デザインを採用する動きが加速すると予想されます。
実務でのポイント
① 「柔軟性」を「事前計画」で担保する
アダプティブの本質は、事前に規定した選択肢の中から中間データに応じて選ぶこと。現場判断での変更は許されない。
② シミュレーションで operating characteristics を定量化する
Type I 誤り・検出力・期待症例数・期待試験期間を複数シナリオで評価し、申請資料に添付する。R の gsDesign、rpact、adaptTest などが定番。
③ 情報ファイアウォールを設計する
ISAC・IDMCの役割分担、盲検化解除の範囲、伝達ルートを治験開始前に固める。ここを怠るとデータの信頼性が根本から損なわれる。
④ 規制当局との早期対話を怠らない
PMDA対面助言・FDA Type C Meeting・EMA Scientific Advice の活用は、確証的アダプティブ試験では事実上マストである。
⑤ ベイズ流を使うなら頻度論的 operating characteristics も示す
事後確率ベースの意思決定でも、Type I 誤りの制御をシミュレーションで立証することが国際標準の期待水準。
📚 この記事をより深く理解するための参考書籍
アダプティブデザインとICH E20をさらに深く学びたい方に、実務で役立つ書籍をランキング形式でご紹介します。

関連記事・次のステップ
本記事はICH E20の全体像と国際調和の最新動向をまとめたものですが、アダプティブデザインの個別トピックや関連ICHガイドラインについては、以下の既存記事もあわせてお読みいただくと理解が深まります。
- アダプティブデザインとは何か:FDAガイダンスから学ぶ基礎と原則:FDA 2019年ガイダンスを軸にした基礎解説。E20と比較すると国際調和の論点が立体的に見えます。
- 比較データに基づくアダプティブデザインと特別な考慮事項:実務で使いこなすための徹底解説。運営上の落とし穴を具体的に紹介しています。
- アダプティブデザイン臨床試験の理解と展望:概論と将来展望。入門編として最適です。
- Estimandを理解するために:ICH E9(R1) の Estimand フレームワーク。アダプティブ下での集団変更とエスティマンドの整合を考えるうえで必読です。
- 【徹底解説】ICH E10「臨床試験における対照群の選択」:対照群設計の原則。アダプティブで対照アームの継続可否を議論する際の土台になります。
まとめ
本記事では、ICH E20「臨床試験のためのアダプティブデザイン」の背景・ステータス・主要類型・統計原則・試験運営上の考慮事項・既存ガイダンスとの関係を体系的に整理しました。E20 は 2025年6月に Step 2b に到達し、同年11月末にパブリックコメント(Step 3)が完了しました。現在は Step 4 最終化審議中であり、2026年10月の最終合意が目標とされています。国際調和文書としての E20 は、各地域ガイダンスの原則層を提供し、確証的試験におけるアダプティブデザインの許容範囲を明確化するものです。
実務の現場では、事前計画・Type I 誤りの厳格制御・情報ファイアウォールの構築・規制当局との早期対話という4点を徹底することが、アダプティブデザインを成功させる鍵になります。Rの gsDesign パッケージで群逐次デザインを検討する経験は、E20 の原則を直感的に理解するうえで非常に有用です。
アダプティブデザインは、今後ベイズ流アプローチ・マスタープロトコル・リアルワールドデータとの統合という方向でますます重要性を増していきます。E20 の最終化を契機に、日本の製薬企業・アカデミア・規制当局の連携が一段と深まることを期待したいところです。国際共同治験でアダプティブを提案する機会がある方は、ぜひ本ガイドラインを早い段階でキャッチアップし、「柔軟性と科学性を両立した臨床試験デザイン」を実現していただければと思います。
次回は、ベイズ流アダプティブデザインの具体例とRによる事後確率を用いた意思決定の実装について、より手を動かす形で紹介する予定です。











