こんにちは!
皆さんは、Pythonで線形近似式を可視化したいと思ったことはありませんか?
線形近似式って色々使い勝手がいいよね!
Pythonで線形近似式を可視化するには、Seabornの「lmplot()」を使うと簡単に表示することができますよ。
Seabornライブラリのインストールが終わっていない方は、インストールしておきましょう。
今回の記事では、以下の内容について紹介します。
- lmplot()の基本的な使い方
- lmplot()の様々なオプション
線形近似式を可視化する lmplot()
線形近似式を表示するには、「lmplot()」を使用します。
lmplot()の基本的な使い方
lmplot()の基本的な書式は以下になります。
seaborn.lmplot(x, y, data)
x, yはdata内に存在する表示したいカラム名、
dataは表示したいデータです。
以下のプログラムは、irisデータセットの線形近似式を表示するプログラムです。
from sklearn.datasets import load_iris
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['species'] = iris.target_names[iris.target]
sns.lmplot(df.columns[0], df.columns[1], df)
plt.tight_layout()
plt.show()
実行結果
このように、sepal widthとsepal lengthの線形近似式が簡単に描くことができます。
様々なオプション
よく使われるオプションを紹介します。
すべてのオプションが気になる方は、公式ドキュメントを参照してください。
オプション | 説明 | デフォルト値 |
hue | カテゴリデータごとに色分け | |
col | カテゴリデータごとに表示(横表示) | |
row | カテゴリデータごとに表示(縦表示) |
hue
「hue」にカテゴリデータが格納された列名を指定することで、カテゴリ名ごとに色分けすることができます。
sns.lmplot(df.columns[0], df.columns[1], df, hue='species')
実行結果
col
「col」にカテゴリデータが格納された列名を指定することで、カテゴリ名ごとに横にグラフを並べて表示することができます。
sns.lmplot(df.columns[0], df.columns[1], df, col='species')
実行結果
row
「row」にカテゴリデータが格納された列名を指定することで、カテゴリ名ごとに縦にグラフを並べて表示することができます。
sns.lmplot(df.columns[0], df.columns[1], df, row='species')
実行結果
まとめ
今回の記事では、以下の内容を紹介しました。
- lmplot()の基本的な使い方
→x, y, dataを指定
散布図と、線形近似式を出力 - lmplot()の様々なオプション
→色分けが簡単にできるetc…
簡単に線形近似式を可視化することができたね!
線形近似式を簡単に可視化する方法をしっかりと覚えて、データがどのような傾向があるのかをつかむのに役立てましょう!