こんにちは!
皆さんは特徴量と説明変数・目的変数の違いについて理解していますか?
もしかすると、特徴量と説明変数は同じものだと思っている方も中にはいるかもしれませんが、実は少し違います。
この部分をしっかりと理解しておくと、後々の機械学習の勉強が捗りますよ!
今回の記事では、以下の内容について紹介します。
- 特徴量について
- 説明変数・目的変数について
- 特徴量と説明変数・目的変数の違いについて
特徴量とは
機械学習における特徴量とは、物事や事象などの特徴が表現されたデータのことです。
特徴量のデータには、数字だけではなく、数字ではないデータも存在します。
例えば、人間の体に関するデータがあった際に、身長や体重、性別などの情報は全て特徴量になります。
説明変数・目的変数とは
まず目的変数について説明します。
機械学習における目的変数とは、予測したい変数のことです。
そして、説明変数とは、目的変数を説明することができる変数のことです。
例えば、人体のデータから性別を予測したいとすると、性別が目的変数となり、その他の変数、以下の表の場合は身長と体重が説明変数となります。
予測したい対象を変更すると、目的変数、説明変数は変わります。
例えば、身長と性別から体重を予測したいと考えたときには、身長と性別が説明変数、体重が目的変数となります。
ちなみに、説明変数と目的変数を学習に使用するのが、教師あり学習、
説明変数のみを学習に使用するのが教師なし学習ということも同時に押さえておきましょう。
・【機械学習】教師あり学習、教師なし学習について簡単に解説!それぞれのアルゴリズムを紹介
特徴量と説明変数・目的変数の違い
では、特徴量と説明変数・目的変数はどこが違うのでしょうか?
先程の表をまとめた表を見てみましょう。
上記の表を見てみると、特徴量と説明変数・目的変数がイコールではないことがわかるでしょうか?
特徴量はただ単に、特徴が表現されたデータのことで、説明変数、目的変数の両方とも特徴量ということができます。
また、以下の表のようにデータに年齢という項目を付け加えてみました。
年齢というのは、目的変数である性別にはあまり関係なさそうな要素です。
そのため、説明変数として年齢を使わない方が、機械学習において、性別を予測する際には精度が良くなると思います。
年齢という項目を追加しましたが、使わないことにしましょう。
使わないということで、年齢は説明変数でも、目的変数でもなくなりました。
しかし、この年齢という項目も特徴量ということができます。
これで、特徴量と説明変数・目的変数の違いが理解できたでしょうか?
説明変数・目的変数は、特徴量の一部または全部ということができます。
よく、特徴量=説明変数と勘違いされている方がいらっしゃるかと思いますが、目的変数も特徴量ということができますし、説明変数、目的変数でないデータでも特徴量ということができます。
特徴量はただ単に特徴が表現されたデータのこと、説明変数・目的変数は予測に使用するデータと予測対象のデータということを覚えておきましょう!
まとめ
今回の記事では、以下の内容について紹介しました。
- 特徴量について
→物事や事象などの特徴が表現されたデータ - 説明変数・目的変数について
→目的変数:予測したい変数
説明変数:目的変数を説明することができる変数 - 特徴量と説明変数・目的変数の違いについて
→説明変数・目的変数は特徴量の一部
皆さんも、しっかりと押さえて機械学習の勉強に取り組みましょう!