- 関心のあるイベント(四肢切断)発現までの時間について解析する際、そのイベントと関連のありそうなイベント(死亡、原因は不問)を「打切り」と扱うと、Tarone検定で仮定しているモデルに合致しない
- このような場合、第1種の過誤率が名義上の値(有意水準)を上回る可能性がある
- 従って、データの性質を適切に考慮したモデルに基づく検定統計量が必要
そこで、(打切りのある)生存時間データに対する傾向性検定として有名なTarone検定に対して、モンテカルロシミュレーションを使用した第1種の過誤率の推定を試みた。
準競合リスクデータを、Gumbelの2変量指数分布に従うと思しき乱数(この話も後日述べてみたい)を発生させ、さらに打切り時間を一様乱数でシミュレートし、第1種の過誤率を推定した結果、名義上の値(片側検定だったので2.5%)を上回る5%強の値を軒並み示した。
「とりあえず第1関門クリア」…と思いきや、2種類のイベントが独立である場合にも5%強の第1種の過誤率を示した。
あれっ?
これはTarone検定の性能に問題があるってことなんだろうか?あるいは、
- Tarone検定を実装した自作のRプログラムのバグ(テキストで答え合わせはしたのだが・・・)?
- シミュレーションデザインに問題?
- 第1種の過誤率の推定アルゴリズムが問題(カウントと単純な割り算だけだが・・・)?
Tarone検定が研究の主題ではないものの、研究テーマの導入部分に拘る問題なので、会社のSAS(Tarone検定が実装済)で試してみたい。
変な問題を見つけてしまったものだ。Tarone検定があまりにマイナーな手法なので、まじめに評価した人がいなかったんだろう。
0 件のコメント:
コメントを投稿