入力の関連性の確認

データをインポートする際に、入力の関連性(出力に対する影響度)を確認することができます(チュートリアルの入力の関連性を確認するを参照)。

これを調べるためには、入力と出力に対して多項式の段階的回帰が行われます。重要度が5%未満の入力が無視されるので、依存性のある入力を見つけることができます。

たとえば、トレーニングデータに3つの入力(speedloadspeed + load)が含まれていて、そのうちのひとつの重要度が低い、といった例が挙げられます。

各入力の順番が重要になります。段階的回帰によって入力は列ごとに並べ替えられ、擬似RMSEが入力ごとに計算されて、ヒューリスティックな入力の関連性が得られます。調査結果は "Relevance of Inputs" ウィンドウにプロットされます。

参照

入力の関連性を確認する

Relevance of Inputs