データ分析

Python

Python初学者向け:seabornによる描画を基本から解説(ヒストグラム編)

数回にわたってseabornによる可視化を基本から解説します。今回はヒストグラムを扱います。既にmatplotlibで描画する方法を紹介していますが、seabornによる実装も確認しておきましょう。seabornはmatplotlibのラッパーライブラリで簡単な手順できれいな描画をすることができます。
Python

Python初学者向け:箱ひげ図を基本から解説

今回は箱ひげ図を取り扱います。これはデータのばらつきを見る際につかいます。前回、ヒストグラムを扱いましたが、箱ひげ図では複数のデータのばらつきを比較することができるので、こちらも是非押さえておきましょう。matplotlibで簡単に描くことができます。
Python

Python初学者向け:ヒストグラムと棒グラフを基本から解説

今回は分布を可視化する方法として、ヒストグラムと棒グラフの基本を解説します。データを手にしたらまずは各変数の基本統計量や分布を確認するとよいでしょう。分布の確認は可視化するのがいちばんわかりやすいです。さっそく見ていきましょう。
Python

Python初学者向け:複数のグラフを並べて描く方法を基本から解説

今回は複数のグラフを並べて描く方法を基本から解説します。グラフを重ねて描くこともありますが、並べて比較したいときもありますね。いくつかのやり方があるうえに、使用するメソッド名も似ているので混乱することもあると思います。今回はこれらを整理しましょう。
Python

Python初学者向け:散布図の描画を基本から解説

今回はmatplotlibで散布図を描く方法を基本から解説します。引数は必要な時に「Shift + Tab」でdocstringをみて確認すればよいので、全部覚える必要はありません。基本的な使い方と、どんなことができるかを抑えておけばよいでしょう。さっそく始めましょう。
Python

Python初学者向け:groupbyの処理結果を描画する方法を解説

今回はgroupbyでデータをグループ分けして処理した結果を描画してみましょう。データの概要を把握するときには、グループごとの特徴を把握するために集計しますよね。これを比較するときにただ値を見るだけでなく、可視化するとよりわかりやすくなります。
Python

Python初学者向け:matplotlibによる可視化を基本から解説

データの可視化を基本から解説していきます。まずはデータの可視化ライブラリmatplotlibの使い方からみていきます。今回は第一回目なので一番ベーシックな折れ線グラフの書き方から始めることにしましょう。
Python

Python初学者向け:ピボットテーブルを基本から解説します

今回はpandasのpivot_table()について基本を解説します。EXCELなどでデータ集計をするときによくおこなう操作なので、なじみ深い人も多いのではないでしょうか?ピボットテーブルはグループごとに集計して比較するときに使います。
Python

Python初学者向け:データフレームの繰り返し処理を基本から解説

▶ Pandasの基本を解説しています。Series/DataFrameの作り方は以下をご覧ください。 はじめに 今回はデータフレームのイテレーションについて基本から解説します。イテレーションとは簡単にいうと繰り返しのことです。これまでにも...
Python

Python初学者向け:groupbyについて基本から解説

▶ Pandasの基本を解説しています。Series/DataFrameの作り方は以下をご覧ください。 はじめに 今回はデータを集計する際の必須操作となるgroupbyについて基本から解説します。groupbyはデータをグループ分けして共通...
Python

Python初学者向け:データフレームの列の値を書き換える方法を基本から解説します

今回はデータフレームに値を代入するときに注意することをまとめていくことにします。データフレームの特定の列に値を代入するのはよくおこなう操作だと思いますが、代入するのがリストやndarrayであるときと、Seririesであるときで挙動が違います。この辺を整理していきましょう。
Python

Python初学者向け:DataFrameの基本操作を解説(行・列の抽出)

今回はDataFrameの基本操作である、行や列を指定したデータの抽出方法の基本を確認していきます。列の指定・行の指定をいろいろなパターンでみていきましょう。行の指定では、ラベルが設定されている場合とされていない場合にわけて基本の抽出方法をじっくりみていくことにしましょう。
Python

Python初学者向け:Pandasのデータ構造DataFrameについて基本から解説

Pandasの2つの主要なデータ構造であるSeriesとDataFrameのうち、2次元の表形式のデータを処理する「DataFrame」について基本から解説します。DataFrameとは何かの確認から始めて作り方までをみていきましょう。
Python

Python初学者向け:Pandasのデータ構造Seriesについて基本から解説

今回からデータ解析のためのPythonライブラリであるPandasを扱います。まずはPandasの2つの主要なデータ構造であるSeriesとDataFrameのうち、Seriesについて基本から解説します。Seriesとは何かの確認から始めて作り方までをみていきましょう。
Python

Python初学者向け:ndarrayの保存と読み込みについて基本から解説

今回はndarrayの保存と読み込みについて基本から解説していきます。保存については何も難しいことはありませんが、保存したndarrayを読み込むときには注意が必要です。実際に例を示しながら丁寧に解説していきます。
Python

Python初学者向け:ndarrayの結合方法を基本から解説

今回はndarrayの結合方法を扱います。ndarrayの結合にはいろんな関数が用意されていますが、最も基本的なnp.concatenate()とnp.stack()について基本から解説していきます。これらをしっかり学んでおけば、他のnp.hstack()やnp.vstack()なども同様に扱うことができます。
Python

Python初学者向け:ndarrayを条件に応じて処理する方法を基本から解説

今回はndarrayを条件に応じて処理する方法を扱います。ndarray[条件]のように条件を満たすデータを抽出方法やwhereを使って条件に応じて処理をおこなう方法を基本から解説します。また「すべての要素が条件を満たす」「要素のうち少なくとも1つが条件を満たす」行・列の抽出方法についても解説します。
Python

Python初学者向け:NumpyでのNaNの扱いを整理する

今回はNumpyでのNaNの扱いについてまとめておきましょう。PythonでNaNを判定する方法として「isnan」がありますが、Numpyの際にはちょっと扱いが異なります。このあと、学習を進めていく中で混乱しないように、はじめに整理しておきましょう。
Python

Python初学者向け:Numpyでよく使う関数を基本から解説

今回はNumpyでよく使う関数についてまとめていくことにします。最大値・最小値・平均値・中央値・標準偏差のような統計量を算出するもののほか、よく使う関数を紹介していきます。関数名も直感的でわかりやすいため、気楽に取り組みましょう。
Web

GoogleAnalyticsのデータをスプレッドシートに連携して取得する方法を基本から解説

今回はGoogle Analyticsから複数のレポートを取得している方向けに、スプレッドシートのアドオンを使って自動でデータを取得する方法を基本から解説します。スプレッドシート上にデータを自動更新させることもできます。設定にはいくつかのステップがあるので、順に説明していきましょう。