【Python】Seabornで線形近似式を簡単に可視化する方法を紹介!

こんにちは!

皆さんは、Pythonで線形近似式を可視化したいと思ったことはありませんか?

Python初心者
線形近似式って色々使い勝手がいいよね!

Pythonで線形近似式を可視化するには、Seabornの「lmplot()」を使うと簡単に表示することができますよ。

Seabornライブラリのインストールが終わっていない方は、インストールしておきましょう。

今回の記事では、以下の内容について紹介します。

  • lmplot()の基本的な使い方
  • lmplot()の様々なオプション

線形近似式を可視化する lmplot()

線形近似式を表示するには、「lmplot()」を使用します。

lmplot()の基本的な使い方

lmplot()の基本的な書式は以下になります。

seaborn.lmplot(x, y, data)

x, yはdata内に存在する表示したいカラム名
dataは表示したいデータです。

以下のプログラムは、irisデータセットの線形近似式を表示するプログラムです。

from sklearn.datasets import load_iris
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['species'] = iris.target_names[iris.target]

sns.lmplot(df.columns[0], df.columns[1], df)

plt.tight_layout()
plt.show()

実行結果

このように、sepal widthとsepal lengthの線形近似式が簡単に描くことができます。

様々なオプション

よく使われるオプションを紹介します。

すべてのオプションが気になる方は、公式ドキュメントを参照してください。

オプション 説明 デフォルト値
hue カテゴリデータごとに色分け
col カテゴリデータごとに表示(横表示)
row カテゴリデータごとに表示(縦表示)

hue

「hue」にカテゴリデータが格納された列名を指定することで、カテゴリ名ごとに色分けすることができます。

sns.lmplot(df.columns[0], df.columns[1], df, hue='species')

実行結果

col

「col」にカテゴリデータが格納された列名を指定することで、カテゴリ名ごとに横にグラフを並べて表示することができます。

sns.lmplot(df.columns[0], df.columns[1], df, col='species')

実行結果

row

「row」にカテゴリデータが格納された列名を指定することで、カテゴリ名ごとに縦にグラフを並べて表示することができます。

sns.lmplot(df.columns[0], df.columns[1], df, row='species')

実行結果

まとめ

今回の記事では、以下の内容を紹介しました。

  • lmplot()の基本的な使い方
    x, y, dataを指定
     散布図と、線形近似式を出力
  • lmplot()の様々なオプション
    色分けが簡単にできるetc…
Python初心者
簡単に線形近似式を可視化することができたね!

線形近似式を簡単に可視化する方法をしっかりと覚えて、データがどのような傾向があるのかをつかむのに役立てましょう!