2007年12月30日日曜日

本年最後の週は…

今週は年の瀬ということもあり、いわゆる通常業務や飛び込み的作業は発生しなかった。
そのため、(再)来年以降の準備(のための準備?)を始める時間を取ることができた。

オフィス全体が年末モードで、どことなく平和ムード漂う1週間であった。

2007年12月23日日曜日

リソースマネージメント?

今週は来年度の予算やらスケジュールやら、リソース調整に関する作業が多かった。

やってみて分かったことは
  • 2008年末~2009年6月に4プロジェクトの担当業務が重なる
  • 2010年9月には過密スケジュールを強いられる
  • これらの事実から、2008年中に余程準備を入念にしておかないと業務が破綻するリスクが高いことが予想できる
ということである。んー、今から気が重い・・・。

2007年12月16日日曜日

ファイルはうまく保存して

今週は
  • 自分の担当プロジェクトの紹介(所属グループ向け)の準備
  • 旧要員の作成したある報告書の探索
  • 逐次集計用のデータ取り込みプログラム作成
が主な業務であった。

「…報告書の探索」は、(外付け)ハードディスクから電子ファイルを検索するだけなのだが、その保存状況が
  • 同じものがいくつも保存
  • フォルダの構成も検索の手がかりにならない、というよりむしろ妨害
  • ファイルサイズが計45GBなので全て検索するなど非現実的
ということで、ファイルの更新日付等外部情報を用いて検索範囲を絞り込み、とりあえず一段落を付けることができた。

教訓:同じものを何度も保存しない。スナップショットをどうしても保存したければ、せめて圧縮する等の工夫は必要。また、フォルダ名は考えて命名する。

2007年12月10日月曜日

データにエラー?

Multi-stateモデル解析用のRプログラムでは、個々の状態について

  1. その状態に推移した時間
  2. その状態から別の状態に移った時間
を引数に取り、1.<2. となることを事前要件としている。
一方、(自分で導出したので怪しい限りだが)ID

  • 3905
  • 4999
  • 6490
については1.=2.となっている。

追跡中止・治療中止の管理が甘いのがこのデータの欠点で、Time-to-event解析にとっては結構痛いエラーなのだが・・・

2007年12月9日日曜日

Multi-stateモデル入門メモ

Multi-stateモデルとは、いくつかの「状態」(ある疾患への罹患、機械の動作状況等)とある状態から別の状態への推移時間に対するモデル化の総称である。

状態の推移を問題にするのだから、ある状態とそこから推移した後のある状態の間に何らかのモデルを仮定するのは自然な発想である。Time-to-eventデータの場合はCox回帰モデルが最も標準的であろう。

その仮定の置き方は…

  • 個々の推移パスに対してハザード関数のモデル化を目指す「Markov stratified hazards」モデル
  • ある状態への推移が複数想定される場合、各推移のハザードが比例関係にあると仮定する「Markov proportional hazards」
  • ある状態への推移のハザードが、その直前の状態への推移時間に(見方を変えると「直前の状態での滞在時間」)に依存すると仮定する「State arrival extended Markov 」モデル
の3種類が主な所のようである。

引継ぎに追われ…

今週の前半は、年明けに発生する非定型な解析業務の準備を進めた。

集計内容自身は易しいものだが、逐次対応が求められるだけに、データ取り込み処理がネックになると判断。そこで、プログラムに漸く取り掛かることができる所まで来たのだが…。

マネージャーさんから、今月末で退職する方の担当プロジェクト業務をサポートするように依頼されたのだ。

「来週(次週)1週間位でやっといて」

とのことだが、どう優先順位を考えればよいのか。急に依頼が来て困っている所である。

2007年12月1日土曜日

なぜか浮つく1週間

今週は、年明けに「データ入手→すぐグラフ作成」というアクロバット的作業の準備について、何とか一区切り付けることができた。

なかなかグラフの内容に対する要求が細かく、当初はうまくいくか不安はあったが、年内に解決できてまずは一安心である。

ただし、「データの入手→解析用に変換」のプロセスはまだ未解決な部分を残している。

この作業は品質をあまり問わないものなので、与えられた時間は少ないが、できれば色々実験的要素を盛り込んでみたい。