可視化

Web

GoogleAnalyticsのデータをスプレッドシートに連携して取得する方法を基本から解説

今回はGoogle Analyticsから複数のレポートを取得している方向けに、スプレッドシートのアドオンを使って自動でデータを取得する方法を基本から解説します。スプレッドシート上にデータを自動更新させることもできます。設定にはいくつかのステップがあるので、順に説明していきましょう。
Python

初学者向け:Pythonで正規性の検定する方法を基本から解説

今回はPythonで「正規性の検定」する方法を基本から解説していきます。検定自体は1行のコードで済みますが、Q-Qプロットなどで視覚的に確認することも重要です。今回はQ-Qプロットとその描き方を解説して、その次に「シャピロ-ウィルクの検定」で正規性を検定する方法を扱います。
Python

統計学:初学者向けにPythonによる確率分布の取り扱いを基本から解説

今回は確率分布を扱います。確率変数、確率分布の順に解説し、最後にPythonによる実装をおこないます。この投稿を最後まで読むと確率分布とは何かがわかり、実際にPythonでコードをかけるようになります。
Python

統計学:分布の描画方法を初学者向けに基本から解説します

統計学を学んだことがない方を対象に基本から解説しています。今回はデータを入手したらまず最初におこなう「分布」の確認についてです。分布を確認するにあたり、連続変数の場合とカテゴリ変数の場合に分けて、Pythonによる可視化の方法を基本から解説します。
Python

Python基礎:決定木の解釈

はじめに これまでも何回か扱ってきた決定木ですが、今回は決定木を可視化して解釈する部分を解説します。決定木分析を使うのは、結果の説明を求められるときが多いかと思います。そこで、可視化した結果をどのように解釈して説明すればよいのか、を考える...
Python

Python初心者向け:グラフを並べて比較する方法を基本から解説

Python初心者の方向けに複数のグラフを並べて比較する方法を基本から解説します。グラフを描くことでよりデータを理解しやすくなります。さらにグラフ同士を並べて比較することで見えてくるものもあります。複数のグラフをつぎつぎと描いて、それを比較する方法を学びましょう。
Python

Python初心者向け:ピボットテーブルの詳細を基本から解説

Python初心者の方向けに、ピボットテーブルの使い方の詳細を基本から解説します。まずは基本的な使い方をおさらいしてから、クロス集計時に適用する関数の変更や、項目ごとに変更する方法をお伝えします。これを読むことで、ピボットテーブルが使いこなせるようになります。
Python

Python初心者向け:add_subplot/subplot/subplotsの違いを整理

Python初心者の方向けに、matplotlibで描画する時のメソッドであるadd_subplot( ), subplot( ), subplots( )について整理しましょう。これらは名称も似ていることから混乱しやすいですが、意味が分かれば大丈夫です。
Python

Python初心者向け:グラフのグリッド表示を基本から解説

Python初心者の方向けにグラフのグリッド表示を基本から解説します。グリッドの行と列に特徴ごとに分けられたグラフを作成するのに役立ちます。今回はPairGrid()、pairplot()、FacetGrid() の使い方をマスターしましょう。
Python

Python基礎:ベン図を描く

Python初心者の方向けにベン図の描き方を基本から解説します。ベン図は複数の集合の関係や集合の範囲を視覚的に表す場合に用います。 この記事を読むことで、matplotlib_vennというライブラリを用いて誰でもベン図を描けるようになります。
Python

Python初心者向け:決定木とランダムフォレストを可視化する

Python初心者の方向けに、ツリー系のアルゴリズムである決定木とランダムフォレストの可視化の方法を基本から解説します。サンプルデータで、まず決定木で分類をおこない次にランダムフォレストで分類して比較します。各特徴量の重要度の可視化もできるようになります。
Python

東京都のコロナウィルス感染者数について~データを眺める~

はじめに 今回も東京都のコロナウィルス感染者数のデータを扱うことにしましょう。今回はpandasを使うことにします。pandas_profilingを使ってデータを眺めて、次にいくつかの描画をすることにします。 データの取得の仕方...
Python

東京都のコロナウィルスの感染者数について~移動平均をプロット~

はじめに 前回に引き続き、東京都のコロナウィルスの感染者数のデータを扱います。今回もpandasを使わずに扱う場合と、pandasを使って扱う場合の2通りでやってみましょう。前回は日々の新規感染者数の変化をプロットしましたが、これでは傾...
Python

東京都のコロナウィルス感染者数について

はじめに 今回は実際に東京都のWebページで公開されている、コロナウィルス感染者数の推移を可視化してみます。いままでpandasを使っていろんな処理をしてきましたが、今回は、「pandasを使わずに処理」と「pandasを使って処理」の...
Python

データ分析基礎:決定木

はじめに 今回は「決定木」を扱います。 決定木は結果の可読性が高いため非常に有用です。 機械学習に対する理解があまり得られていない職場でも、データを活用した施策の合意が得られやすいため、数あるアルゴリズムの中で決定木が選ばれることもあり...
Python

Python初心者向け:データの可視化の方法を基本からまとめました

データ分析の初心者にもわかるように、データの可視化の方法を基本から丁寧に解説します。この記事を読むことで、グラフを描く基本的な方法が理解でき、多くのグラフを描くことができ量になります。matplotlibとseabornライブラリを使った可視化を解説します。
Python

Python:相関関係の可視化

はじめに モデリングをする場合は、そもそもデータ同士の関係がないものをいくら集めてもうまくいかないことがあります。関係があるデータを選ぶときは相関係数を求めることで関係の強さがわかりますが、これを視覚的に確認することもできます。 サン...
Python

Python:可視化(ヒストグラム)

はじめに ヒストグラムはデータの分布状況を可視化するときに使うグラフとなります。データを見るだけではなかなか把握しにくい、ばらつきを可視化することができます。ヒストグラムは横軸に階級、縦軸に度数をとり、各階級の度数を長方形の柱で表します...
Python

Python初心者向け:カテゴリごとに描画する方法を基本から解説

Python初心者の方向けにカテゴリごとに描画する方法を基本から解説します。データ分析の基本は比較と可視化です。グラフ同士を比較するのもとても重要です。今回はカテゴリ別のプロットを「比較」する方法を扱います。データから何かを読み取ろうとするときに大きな力を発揮します。
Python

Python:可視化(折れ線グラフ)

はじめに 前回扱ったSeabornで「カテゴリごとに散布図を並べて描画」で、Seabornが簡単で便利であることが伝わったかと思います。今回も引き続き、Seabornで描画していきましょう。基本的なグラフである折れ線グラフを扱います。 ...