Python

Python初心者向け:seabornでのグラフ作成を基本から解説

Python初心者の方向けにseabornライブラリを使ったグラフの作成方法を基本から解説します。seabornはMatplotlibの機能をより美しく、より簡単に実現するためのラッパー的存在です。今回の記事を読むことで、seabornによる描画が一通りできるようになります。
Python

Python:可視化(グラフに注釈をつける)

Python初心者の方向けにグラフにテキストで説明を加える方法を基本から解説します。タイトルや軸ラベルだけではなく、グラフ上に補足を加えるとより分かりやすいことがありますね。今回は単純にテキストを表示する方法と、矢印で説明箇所を指し示す方法の2つをご紹介します。
Python

Python初心者向け:グラフに線を加える方法を基本から解説

Python初心者の方向けにグラフに水平線・垂直線を入れる方法を基本から解説します。このような線を加えることで、グラフを見る人の注意を惹きつけて理解しやすくすることができるます。基準となる値などを水平線・垂直線で表してよりわかりやすいグラフを作成しましょう。
Python

Python初心者向け:グラフに第2軸を設定する方法を基本から解説

Python初心者の方向けに、グラフに第2軸を設定する方法を基本から解説します。一つのグラフ領域に2つのプロットするケースでは、第2軸を設定したくなることがありますよね。プロットの種類が違う場合やデータのスケールが大きく異なる場合は、軸をわけるとみやすくなります。
Python

Python:可視化(plt.subplots)

はじめに これまではAxesオブジェクトを作るときに、Figureオブジェクトを生成したあと、Axesオブジェクトを追加してplot()メソッドで描画する、という流れでグラフを生成してきました。これに対して、はじめからFigureオブジ...
Python

Python:可視化(サブプロットの調整)

はじめに前回はサブプロットを扱いました。図(Figure)よりも小さいサブプロットという単位でグラフを描画する領域を操作します。サブプロットは、図を分割するレイアウトを行数、列数で指定して、そのレイアウトの中で対象とする位置を指定するのでし...
Python

Python:可視化(グラフオブジェクトによる操作時の各種設定)

はじめに 前回、グラフオブジェクトによる操作で描画する方法を扱いました。グラフオブジェクトによる操作で描画するには、操作対象とするオブジェクトを明示的に指定すればよいのでした。但し、違いはこれだけではありません。これまで扱ってきた、「グ...
Python

Python:可視化(グラフオブジェクトによる操作)

はじめに これまでおこなってきたようなplot関数によるグラフの描画やsubplot関数は、グラフの土台になるオブジェクトやグラフ要素のオブジェクトを内部的に生成します。そのため、オブジェクトの操作を気にすることなくグラフの描画をおこな...
Python

Python:可視化(目盛の設定)

Python初心者の方向けに表示範囲の設定と目盛の設定方法について基本から解説します。データを比較するためには、適した表示範囲設定が必要です。また、目盛を設定することで数値を読み取りやすくなり、データを正しく理解する助けになることでしょう。
Python

Python初心者向け:グラフに凡例を表示する方法を基本から解説

Python初心者の方向けにグラフに凡例を表示させる方法を基本から解説します。グラフを使うことデータの分布をみたり、「比較」をすることができます。今回はグラフ上に2つのプロットをしたときに、「比較」しやすいように凡例を表示する方法を紹介します。
Python

Python:グラフ周りの設定

はじめに 前回は、散布図、折れ線グラフ、ヒストグラム、棒グラフ、箱ひげ図の描き方を扱いました。matplotlibでは、ほとんど同じ書式で、グラフの指定方法だけ変えればこれらのグラフを描くことができることを確認しました。 ...
Python

Python:データを可視化する

はじめに これまでデータの概要を把握する方法をいくつか見てきました。まずは基本統計量などを算出する前に、まずは欠損値の処理をおこないます。 欠損値の処理が終わったら、基本統計量などをみてみるとよいでしょう。但し、統計量...
Python

Python:欠損値の取り扱い

はじめに Pandasでは、欠損値NaNがあるデータを扱っても基本的にはエラーとはなりませんが、処理結果がNaNになることが多いです。一部の関数では、NaNを除いて処理をおこない、結果を返してくれるものもありますが、基本的には処理前に欠...
Python

Python:データから情報を取り出す

はじめに データ分析の流れを説明するシリーズで、「データの概要把握」のプロセスに関する記事を書いています。「データの概要把握」のプロセスでは、これまで、データの読み込みから始めて、データの確認、データ型の変換、列名の変更と値の変換、条件...
Python

Python初心者向け:条件に応じて代入する値を変える方法を解説

Python初心者の方でも簡単に、条件に応じて値を代入する方法を基本から解説します。今回は、ブールインデックスとwhere( )メソッドを使う方法を基本からお伝えします。この投稿をみていただくことで、条件式をにより代入する値をかえることができるようになります。
Python

Python:列名の変更と値の変換

はじめに 今年の初めから、データ分析の流れをシリーズで掲載しています。前回までに データの読み込み 基本統計量など、基本的なデータの概要把握 データ型の変換 を扱いました。 データ型が正しくなければ、正しい分析はで...
Python

Python初心者向け:データ型の変換を基本から解説

Python初心者の方向けにデータ型を変換する方法を基本から解説します。文字列型→数値型、数値型→文字列型とする方法を説明した後、日付型→文字列型、文字列型→日付型とする方法を説明します。データを読み込んだ後はデータ型を確認して、適切な型で扱うようにしましょう。
Python

Python初心者向け:読み込んだデータをまず確認する方法をお伝えします

Python初心者の方でもわかるように、まずはデータを確認する方法をお伝えします。単純に読み込んだデータの先頭の数行や末尾の数行、各列のデータ型などを確認する方法を基本からお伝えします。最後に基本統計量をまとめて抽出する方法もご紹介します。
Python

Python初心者向け:データの読み込むときのいろんなパターンを解説

Python初心者の方でも迷わずにデータを読み込むことができるように基本から解説します。手元にあるデータはいつもきれいなデータとは限りません。先頭に不要な行があったり、列項目をすべて使う必要がない場合もあります。このようなデータの取り込みを例を使って説明します。
その他

Python:データ分析の流れ

はじめに 今回は、分析を行う際の進め方について書きます。「このようにやれば絶対OK」というようなものはありませせんが、基本的な考え方を確認していきましょう。今回は全体の流れを説明して今後は各プロセスの詳細について投稿を追加していくことに...