SSブログ

状態空間モデルで欠損値の扱い方 [データサイエンス、統計モデル]

最近、とあるデータに対して状態空間モデルを適用しました。
このデータ、ある時点で、予測値が急激に下振れるポイントが存在します。
例えば、台風とか地震とかが原因と仮定します。

そのまま状態空間モデルで推定すると、その前後でトレンドが減少しているような予測なってしまう。
普通に考えるとそうなるのも自然なのですが、欲しい結果としては、
その事象が起こるまでは、既存のトレンドを引き継いで、その事象が起こるとトレンドが変化するような構造にしたい。

このような場合の対処法として、
・説明変数変数を入れて補正する
・その区間のデータがなかったものとして(欠損値扱いにして)処理をする
が考えられます。

試してみたところ、どちらも上手く推定できていました。

通常のARIMAモデルとかだと欠損値があると推定できないけど、状態空間モデルの枠組みだと、このようなデータに関しても扱えるのが便利かなと思います。
ちなみに、プログラムは、stanを使って推定しました。

nice!(3)  コメント(0) 
共通テーマ:学問