おつまみ日記NEO: Tarone検定のサイズ（第1種の過誤率）を推定しようとした所…

研究テーマである「準競合リスク（Semicompeting Risks）存在下での傾向性検定」は、

関心のあるイベント（四肢切断）発現までの時間について解析する際、そのイベントと関連のありそうなイベント（死亡、原因は不問）を「打切り」と扱うと、Tarone検定で仮定しているモデルに合致しない
このような場合、第1種の過誤率が名義上の値（有意水準）を上回る可能性がある
従って、データの性質を適切に考慮したモデルに基づく検定統計量が必要

・・・という問題提起から来たものである。

そこで、（打切りのある）生存時間データに対する傾向性検定として有名なTarone検定に対して、モンテカルロシミュレーションを使用した第1種の過誤率の推定を試みた。

準競合リスクデータを、Gumbelの2変量指数分布に従うと思しき乱数（この話も後日述べてみたい）を発生させ、さらに打切り時間を一様乱数でシミュレートし、第1種の過誤率を推定した結果、名義上の値（片側検定だったので2.5％）を上回る5％強の値を軒並み示した。

「とりあえず第1関門クリア」…と思いきや、2種類のイベントが独立である場合にも5％強の第1種の過誤率を示した。

あれっ？

これはTarone検定の性能に問題があるってことなんだろうか？あるいは、

Tarone検定を実装した自作のRプログラムのバグ（テキストで答え合わせはしたのだが・・・）？
シミュレーションデザインに問題？
第1種の過誤率の推定アルゴリズムが問題（カウントと単純な割り算だけだが・・・）？

といった点に問題があるのだろうか？

Tarone検定が研究の主題ではないものの、研究テーマの導入部分に拘る問題なので、会社のSAS（Tarone検定が実装済）で試してみたい。

変な問題を見つけてしまったものだ。Tarone検定があまりにマイナーな手法なので、まじめに評価した人がいなかったんだろう。

おつまみ日記NEO

2007年8月18日土曜日

Tarone検定のサイズ（第1種の過誤率）を推定しようとした所…

0 件のコメント:

自己紹介