2007年8月18日土曜日

Tarone検定のサイズ(第1種の過誤率)を推定しようとした所…

研究テーマである「準競合リスク(Semicompeting Risks)存在下での傾向性検定」は、

  • 関心のあるイベント(四肢切断)発現までの時間について解析する際、そのイベントと関連のありそうなイベント(死亡、原因は不問)を「打切り」と扱うと、Tarone検定で仮定しているモデルに合致しない
  • このような場合、第1種の過誤率が名義上の値(有意水準)を上回る可能性がある
  • 従って、データの性質を適切に考慮したモデルに基づく検定統計量が必要
・・・という問題提起から来たものである。

そこで、(打切りのある)生存時間データに対する傾向性検定として有名なTarone検定に対して、モンテカルロシミュレーションを使用した第1種の過誤率の推定を試みた。

準競合リスクデータを、Gumbelの2変量指数分布に従うと思しき乱数(この話も後日述べてみたい)を発生させ、さらに打切り時間を一様乱数でシミュレートし、第1種の過誤率を推定した結果、名義上の値(片側検定だったので2.5%)を上回る5%強の値を軒並み示した。

「とりあえず第1関門クリア」…と思いきや、2種類のイベントが独立である場合にも5%強の第1種の過誤率を示した。

あれっ?

これはTarone検定の性能に問題があるってことなんだろうか?あるいは、

  • Tarone検定を実装した自作のRプログラムのバグ(テキストで答え合わせはしたのだが・・・)?
  • シミュレーションデザインに問題?
  • 第1種の過誤率の推定アルゴリズムが問題(カウントと単純な割り算だけだが・・・)?
といった点に問題があるのだろうか?

Tarone検定が研究の主題ではないものの、研究テーマの導入部分に拘る問題なので、会社のSAS(Tarone検定が実装済)で試してみたい。

変な問題を見つけてしまったものだ。Tarone検定があまりにマイナーな手法なので、まじめに評価した人がいなかったんだろう。

0 件のコメント: