入力の関連性の確認
データをインポートする際に、入力の関連性(出力に対する影響度)を確認することができます(チュートリアルの入力の関連性を確認するを参照)。
これを調べるためには、入力と出力に対して多項式の段階的回帰が行われます。重要度が5%未満の入力が無視されるので、依存性のある入力を見つけることができます。
たとえば、トレーニングデータに3つの入力(speed、load、speed + load)が含まれていて、そのうちのひとつの重要度が低い、といった例が挙げられます。
各入力の順番が重要になります。段階的回帰によって入力は列ごとに並べ替えられ、擬似RMSEが入力ごとに計算されて、ヒューリスティックな入力の関連性が得られます。調査結果は
参照