Python

Python

Python:相関関係の可視化

はじめに モデリングをする場合は、そもそもデータ同士の関係がないものをいくら集めてもうまくいかないことがあります。関係があるデータを選ぶときは相関係数を求めることで関係の強さがわかりますが、これを視覚的に確認することもできます。 サン...
Python

Python:可視化(ヒストグラム)

はじめに ヒストグラムはデータの分布状況を可視化するときに使うグラフとなります。データを見るだけではなかなか把握しにくい、ばらつきを可視化することができます。ヒストグラムは横軸に階級、縦軸に度数をとり、各階級の度数を長方形の柱で表します...
Python

Python初心者向け:カテゴリごとに描画する方法を基本から解説

Python初心者の方向けにカテゴリごとに描画する方法を基本から解説します。データ分析の基本は比較と可視化です。グラフ同士を比較するのもとても重要です。今回はカテゴリ別のプロットを「比較」する方法を扱います。データから何かを読み取ろうとするときに大きな力を発揮します。
Python

Python:可視化(折れ線グラフ)

はじめに 前回扱ったSeabornで「カテゴリごとに散布図を並べて描画」で、Seabornが簡単で便利であることが伝わったかと思います。今回も引き続き、Seabornで描画していきましょう。基本的なグラフである折れ線グラフを扱います。 ...
Python

Python:可視化(カテゴリごとに散布図を並べる)

はじめに 前回に引き続きseabornで描画をしていきます。今回は、カテゴリごとに散布図比較する際に、威力を発揮する方法をご紹介します。seabornを使うと明示的にサブプロットを作成しなくても、引数の設定をするだけで、簡単にカテゴリご...
Python

Python初心者向け:seabornでのグラフ作成を基本から解説

Python初心者の方向けにseabornライブラリを使ったグラフの作成方法を基本から解説します。seabornはMatplotlibの機能をより美しく、より簡単に実現するためのラッパー的存在です。今回の記事を読むことで、seabornによる描画が一通りできるようになります。
Python

Python:可視化(グラフに注釈をつける)

Python初心者の方向けにグラフにテキストで説明を加える方法を基本から解説します。タイトルや軸ラベルだけではなく、グラフ上に補足を加えるとより分かりやすいことがありますね。今回は単純にテキストを表示する方法と、矢印で説明箇所を指し示す方法の2つをご紹介します。
Python

Python初心者向け:グラフに線を加える方法を基本から解説

Python初心者の方向けにグラフに水平線・垂直線を入れる方法を基本から解説します。このような線を加えることで、グラフを見る人の注意を惹きつけて理解しやすくすることができるます。基準となる値などを水平線・垂直線で表してよりわかりやすいグラフを作成しましょう。
Python

Python初心者向け:グラフに第2軸を設定する方法を基本から解説

Python初心者の方向けに、グラフに第2軸を設定する方法を基本から解説します。一つのグラフ領域に2つのプロットするケースでは、第2軸を設定したくなることがありますよね。プロットの種類が違う場合やデータのスケールが大きく異なる場合は、軸をわけるとみやすくなります。
Python

Python:可視化(plt.subplots)

はじめに これまではAxesオブジェクトを作るときに、Figureオブジェクトを生成したあと、Axesオブジェクトを追加してplot()メソッドで描画する、という流れでグラフを生成してきました。これに対して、はじめからFigureオブジ...
Python

Python:可視化(サブプロットの調整)

はじめに前回はサブプロットを扱いました。図(Figure)よりも小さいサブプロットという単位でグラフを描画する領域を操作します。サブプロットは、図を分割するレイアウトを行数、列数で指定して、そのレイアウトの中で対象とする位置を指定するのでし...
Python

Python:可視化(グラフオブジェクトによる操作時の各種設定)

はじめに 前回、グラフオブジェクトによる操作で描画する方法を扱いました。グラフオブジェクトによる操作で描画するには、操作対象とするオブジェクトを明示的に指定すればよいのでした。但し、違いはこれだけではありません。これまで扱ってきた、「グ...
Python

Python:可視化(グラフオブジェクトによる操作)

はじめに これまでおこなってきたようなplot関数によるグラフの描画やsubplot関数は、グラフの土台になるオブジェクトやグラフ要素のオブジェクトを内部的に生成します。そのため、オブジェクトの操作を気にすることなくグラフの描画をおこな...
Python

Python:可視化(目盛の設定)

Python初心者の方向けに表示範囲の設定と目盛の設定方法について基本から解説します。データを比較するためには、適した表示範囲設定が必要です。また、目盛を設定することで数値を読み取りやすくなり、データを正しく理解する助けになることでしょう。
Python

Python初心者向け:グラフに凡例を表示する方法を基本から解説

Python初心者の方向けにグラフに凡例を表示させる方法を基本から解説します。グラフを使うことデータの分布をみたり、「比較」をすることができます。今回はグラフ上に2つのプロットをしたときに、「比較」しやすいように凡例を表示する方法を紹介します。
Python

Python:グラフ周りの設定

はじめに 前回は、散布図、折れ線グラフ、ヒストグラム、棒グラフ、箱ひげ図の描き方を扱いました。matplotlibでは、ほとんど同じ書式で、グラフの指定方法だけ変えればこれらのグラフを描くことができることを確認しました。 ...
Python

Python:データを可視化する

はじめに これまでデータの概要を把握する方法をいくつか見てきました。まずは基本統計量などを算出する前に、まずは欠損値の処理をおこないます。 欠損値の処理が終わったら、基本統計量などをみてみるとよいでしょう。但し、統計量...
Python

Python:欠損値の取り扱い

はじめに Pandasでは、欠損値NaNがあるデータを扱っても基本的にはエラーとはなりませんが、処理結果がNaNになることが多いです。一部の関数では、NaNを除いて処理をおこない、結果を返してくれるものもありますが、基本的には処理前に欠...
Python

Python:データから情報を取り出す

はじめに データ分析の流れを説明するシリーズで、「データの概要把握」のプロセスに関する記事を書いています。「データの概要把握」のプロセスでは、これまで、データの読み込みから始めて、データの確認、データ型の変換、列名の変更と値の変換、条件...
Python

Python初心者向け:条件に応じて代入する値を変える方法を解説

Python初心者の方でも簡単に、条件に応じて値を代入する方法を基本から解説します。今回は、ブールインデックスとwhere( )メソッドを使う方法を基本からお伝えします。この投稿をみていただくことで、条件式をにより代入する値をかえることができるようになります。