外れ値の識別と削除によるモデル改良
モデル誤差(モデル予測を基準とした測定値の偏差)が大きい測定ポイントを「外れ値」と呼びます。
プロット上で視覚的に評価することもできますが、条件を定量的に解釈することもできます。残差が 3-4 x RMSE より大きければ外れ値の可能性があります。
視覚的評価は、「モデル予測に対する測定値」の表示(例: Model → Error () → Measured vs. Predicted)を利用して行います。
下図では、エンジンの燃料消費量の測定データをモデル予測に重ねて表示しています。マークされたポイントは、ASCMO-STATIC によって外れ値として識別されたものです。
このような偏差が発生する原因としては、測定装置の不具合などに起因する単純な測定誤差があります。また、エンジンの運転限界付近の不安定な領域で測定が行われたためにモデルによるマッピングができなかった可能性も考えられます。
このような測定ポイントはモデルに悪影響を与えます。次の図の緑色のグラフは青色のポイントに基づくモデリングから得られるものですが、赤色の外れ値も使用してモデルトレーニングを行うと、測定データから逸脱したグラフ(赤色)になってしまいます。
