15. 多重共線性もソフト任せで

藤宮

 重回帰分析の説明を教科書で読んでいると必ず多重共線性の話題が出てきます。そこには「説明変数同士で高い相関を持つものは除かなければならない。」と解説されています。ところが、実際に使用している解析ツールでは、これらの問題のある変数は自動的に除外される機能が備わっています。
 「相関がいくら以上だったら抜いたら良いのでしょうか?」という質問を受けたりしますが、気にせず計算してみて、どの変数が除外されるかを見てみるのもよいかもしれません。

 もちろん、LASSOなどの解析法が使用できる環境(R言語ではglmnetなど)があれば、クロスバリデーションしながら適切な説明変数の組み合わせを選んでくれますので、大変便利です。