2007年11月17日土曜日

データと全く異なる予測値?‐(非線形)モデルの当てはめ

モデルの当てはめに対する私の考えは間違っていたのか?

先日、ある共同プロジェクトの提携先が実施した、ウイルス動態に対する(非線形)モデルの当てはまりを評価するために、パラメータ推定値を基に予測値を算出した。

パラメータ推定値はデータから算出されたものなのだから、予測値はデータとはさほど乖離しないはずだと考えていたし、仮にそうでなければそれは「モデルが当てはまっていない」、つまり当てはめようとしていたモデルの選び方に問題があった可能性が高い。しかし…。

結果を見ると、データとは全般的に全く乖離しており、解釈に困るものであった。

もちろん、

  • 予測値の算出ミス
  • 解析パッケージの影響
  • モデルの当てはまりを「データ全体」ではなく「区分的に」最適になるようにパラメータを推定している
等の可能性は検討の余地はあるのだが、乖離の内容が「企業にとって都合のよい」方向への乖離であることがなお不安を煽る。

モデルへの当てはめはあくまでも「データの説明・次元縮約」が目的であって、「ユーザー側の都合のよい結論を導く」手段ではない。そう考えていたのだが…。

0 件のコメント: