▶ matplotlibによる可視化を基本から解説しています。以下の投稿も合わせてご覧ください。
はじめに
数回にわたってseabornによる可視化を基本から解説します。今回はヒストグラムを扱います。既にmatplotlibで描画する方法を紹介していますが、seabornによる実装も確認しておきましょう。seabornはmatplotlibのラッパーライブラリで簡単な手順できれいな描画をすることができます。
seabornでヒストグラムを描く
サンプルのデータはseabornにあらかじめ準備されている学習用のサンプルデータを使います。「tips」というレストランでのチップに関するデータを使うことにしましょう。
# ライブラリのインポート
import matplotlib.pyplot as plt
import seaborn as sns
# データの取り込み
df =sns.load_dataset('tips')
df.head()
書式
まず書式を確認しておきましょう。
aに配列でデータを与えればOKです。やってみましょう。
seabornでヒストグラムを描く
# ヒストグラム
sns.distplot(df['tip'])
「distplot
is a deprecated function and will be removed in a future version.」と、いう警告が出てますね。将来的にはなくなる関数で非推奨となっています。
ヒストグラムとともに実践で描かれている線は、「カーネル密度推定」です。カーネル密度推定を表示したときは、正規化されたヒストグラムとなるので注意が必要です。(縦軸が度数ではなく正規化されている)通常のヒストグラムとするときには、「kde=False」としてカーネル密度関数を非表示としましょう。
# ヒストグラム
sns.distplot(df['tip'],kde=False)
まとめ
今回はseabornでヒストグラムを描く方法を解説しました。1行できれいなグラフが描けるので楽しくなりますね。度数を確認したいときには、正規化せずに描画するようにしましょう。カーネル密度推定を表示せずに正規化したい場合は、「kde=False」(カーネル密度推定非表示)、「norm_hist=True」(正規化する)とします。この辺は、「Shift + Tab」でDocstringを確認しながらいろいろ試して身につけましょう。
コメント