回帰とは?概念から評価まで徹底解説
2016/05/12
回帰ってなんだろう?何ができるのだろうと考えてる方に対してこのページでは回帰について解説し、その周辺知識として必要な情報も紹介していきます。
このページを読むことで回帰の基本的な知識とかんたんな評価ができるようになるでしょう。ぜひご参考にしてください。
回帰とは?
回帰(regression)とは予測したいデータを数式を用いて予測する手法で、比較的古典的です。
Excelでも回帰はにもありますし、工学部では最小二乗法という形で覚えられた方もいるのではないでしょうか。
ここでは線形回帰(linear regression)について紹介します。線形回帰の数式は下記のようになります。
β0は切片と呼ばれ、どの状況でも一定の影響を与えます。またεは誤差を表現しているようです。測定値などの実験値出ない場合は無視して良いでしょう。
多数のデータセットを用いてX1〜XpからYを求められるようにβ0〜βpの値を算出します。β0〜βpのパラメータさえ決まれば、X1〜XpのデータセットさえあればYを予測が可能というわけです。
ここでデータセットを用いてX1〜XpからYが必要なため回帰では正解付きデータが費用となるため教師あり学習に分類されます。
β0〜βpのパラメータを決める方法には工学部で習う最小二乗法が利用されます。知らない方は特に原理を知る必要もないと私は思いますのでここでは割愛します。