先日、ある共同プロジェクトの提携先が実施した、ウイルス動態に対する(非線形)モデルの当てはまりを評価するために、パラメータ推定値を基に予測値を算出した。
パラメータ推定値はデータから算出されたものなのだから、予測値はデータとはさほど乖離しないはずだと考えていたし、仮にそうでなければそれは「モデルが当てはまっていない」、つまり当てはめようとしていたモデルの選び方に問題があった可能性が高い。しかし…。
結果を見ると、データとは全般的に全く乖離しており、解釈に困るものであった。
もちろん、
- 予測値の算出ミス
- 解析パッケージの影響
- モデルの当てはまりを「データ全体」ではなく「区分的に」最適になるようにパラメータを推定している
モデルへの当てはめはあくまでも「データの説明・次元縮約」が目的であって、「ユーザー側の都合のよい結論を導く」手段ではない。そう考えていたのだが…。
0 件のコメント:
コメントを投稿