以前「Estimandを理解するために」や「中間事象について」といったEstimandに関する内容について記事にしました。試験の目的、Estimandや中間事象の取り扱いによって欠測値の取り扱いや解析方法が異なってきます。そこで今回は欠測値やその取扱いについて記事にしていこうと思います。下記に記事を載せているので、もし興味があれば一読ください。


欠測値とは
欠測値とは統計やデータ分析において 本来あるべきデータが記録されていない、または取得できなかった値 のことを指します。例えば治験中止した、予定来院日に被験者が来なかった等があります。
一方ICH E9(R1)では欠測データを以下のように説明しています。
規定したestimandの解析に対して意味があると考えられるが、収集されなかったデータ。存在しないデータや中間事象の発現により意味があると見なせないデータとは区別されるべきである。
すなわち、少なくともICH E9(R1)では欠測値は意味があるものと考えられており、中間事象と欠測は異なる概念であることを明確に文書で記載する必要がある。
欠測値の取り扱いについて
Ratitchらは、「少なくとも主要評価項目については中間事象発現後のデータを収集することが標準的な方法ではないかと述べているが、中間事象発現後のデータ収集については補足的解析を含めてどのようなestimandでの解析を計画しているのかを鑑みて決定する必要があるだろ。」と記載しております。しかし、最大限データ収集に努力を払ったとしても、欠測データは回避することはできません。特に中間事象とストラテジーによっては収集したデータは同じでも欠測データとなる場合とそうでない場合があることにも注意が必要です。
- 治療方針ストラテジーの場合、データが収集できなかった場合、欠測データに該当する。
- 複合ストラテジーに治験薬中止の中間事象に対し、良/悪 で定義する場合には欠測データと見なされない。(欠測データも悪と判定される)
そのため、欠測データが発生することを考慮に入れた解析手法(mixed model for repeated measure (MMRM)や多重代入法等)を検討する必要があります。
MMRMは繰り返し測定されたデータに強く、欠測値を補完せずにモデル内で推定します。一方、多重代入法は欠測値を複数回補完し、補完の不確実性を反映した分析が可能です。
どちらの手法も「MAR(条件付きランダム欠測)」を仮定しており、欠測の性質や研究デザインに応じて使い分けることが重要です。(こちらについてはそれぞれほかに記事で取り上げたいと思います。)
まとめ
本日は欠測値に関する概要とその取扱いについて説明しました。欠測値が発生した原因を考えて、試験の目的やestimand、中間事象のストラテジーから考えて、この欠測値は意味があるものか、その場合どのような解析を行うことで、意味のある推定量を得ることができるかを考えていく必要があります。
参照
2023年 ”Estimandの治験実施計画書への実装”|日本製薬工業協会 医薬品評価委員会
データサイエンス部会2022年度 継続タスクフォース4