Python

Python

Python基礎:pandasの表示設定

はじめに 今回はpandasの表示設定の方法についてご紹介します。データフレームを表示させたときに、「小数点以下はこんなに表示しなくていいのに」「この列の幅が大きいから全部表示できない」なんてことはなかったですか?今回は表示関する設定を扱...
Python

Python基礎:変数に条件を代入する

はじめに 今回はpandas データフレームから条件に合致した行を抽出する方法をおさらいします。真偽値を使った方法では、変数に条件を代入する方法についても紹介します。条件を変数に入れてしまうことで、条件を変更していろいろ試すのが簡単になり...
Python

Python初心者向け:グラフを並べて比較する方法を基本から解説

Python初心者の方向けに複数のグラフを並べて比較する方法を基本から解説します。グラフを描くことでよりデータを理解しやすくなります。さらにグラフ同士を並べて比較することで見えてくるものもあります。複数のグラフをつぎつぎと描いて、それを比較する方法を学びましょう。
Python

Python初心者向け:SQLiteを使う準備 ~データベースの作成~

Python初心者でもSQLiteが使えるように基本から解説していきます。前回、インストールしたDB Browser for SQLiteを使って、データベースを作成していきます。DB Browser for SQLiteはGUIなので直観的な操作で簡単に扱うことができます。
Python

Python初心者向け:DB Browser for SQLiteのインストール手順の解説

Python初心者でもデータベースのデータの読み書きができるように基本から解説します。ここではWindowsでSQLiteを扱うときに便利なGUIツールであるDB Browser for SQLiteのインストール手順を説明します。
Python

Python初心者向け:ピボットテーブルの詳細を基本から解説

Python初心者の方向けに、ピボットテーブルの使い方の詳細を基本から解説します。まずは基本的な使い方をおさらいしてから、クロス集計時に適用する関数の変更や、項目ごとに変更する方法をお伝えします。これを読むことで、ピボットテーブルが使いこなせるようになります。
Python

Python初心者向け:データフレームの行と列の入れ替えて表示する

Python初心者の方向けにデータフレームの行と列を入れ替える方法を基本から解説します。データを眺めていると、なんか見にくいということがありますよね。そんなときに行と列の入れ替えだけでみやすくなるということもあります。簡単な操作で一発で入れ替えができるので、ぜひ使ってみてください。
Python

Python基礎:パスを結合する

はじめに 今回は、osモジュールを使ったパス結合について扱います。osモジュールに関しては過去に投稿したことがありますが、今回はパス結合に特化した内容にします。パスやファイル名を結合させたい、あるいは、いまいるディレクトリにファイルを追加...
Python

Python初心者向け:クロス集計を思い通りの表示にする方法を解説

Python初心者の方向けに、ピボットテーブルの集計結果を思い通りにする方法を基本から解説します。前回の投稿で、求められる状況によっては、pivot_table()で集計したままのデータでは十分ではないケースをお伝えしました。今回は解決方法をお伝えします。
Python

Python初心者向け:クロス集計の際の注意点を解説

Python初心者向けにクロス集計の際の注意点を基本から解説します。ピボットテーブルを使った集計結果は思い通りのフォーマットになっていますか?実績がない組み合わせであっても、項目自体は表示しておきたいことがあります。今回は気を付けなければいけないところを整理します。
Python

Python:自然言語処理にチャレンジ~環境構築編~

はじめに今回は、今後Pythonで自然言語処理にチャレンジするにあたっての環境構築をおこないます。私はWindowsを使っているのですが、MeCabという形態素解析をおこなうためのライブラリの導入にてこずったので、手順を記しておきます。私の...
Python

Python:pandas 20本ノックをやってみた

はじめに 今回は久しぶりにPythonの話題に戻って、テーブルデータの処理に必須となるpandasライブラリについて扱います。pandasはDataFrameの効率的な実装を提供してくれます。DataFrameでは行と列のラベルが付加され...
Python

Python初心者向け:集合について基本から解説

Python初心者の方向けに集合について、基本から解説します。集合はリストのように複数の要素を持てますが、「要素が重複しない」ように管理されます。ベン図を描くときのデータの指定にもよく使います。集合の作り方・要素の加え方・要素の取り除き方を解説します。
Python

Python基礎:モジュール/パッケージ/ライブラリ

今回も小ネタです。Pythonを勉強していると必ず遭遇する、モジュール・パッケージ・ライブラリという言葉達についてです。blogや書籍などで何度も目にしていて、何となく意味がわかるけど、その違いがよくわからない、という状態だったので、一度...
Python

Python基礎:cut( ), qcut( )

はじめに 今回はビン分割の方法を扱います。ビン分割は連続データを区切ってカテゴリ分けする操作です。年齢を年代別にしたり、体重を階級別にしたりするような操作となります。pandasにcut( ),qcut( )が用意されています。この違い...
Python

Python基礎:osモジュールとglobモジュール

はじめに 今回はPythonライブラリのosモジュールとglobモジュールを扱います。osモジュールはosに依存する機能を利用するためのものです。globは指定したパターンにマッチするファイルパスを取得することができます。これらを組み合...
Python

Python基礎:cumsum( )

はじめに 今回は久しぶりにPythonに戻って、pandasのcumsum( ) メソッドを扱います。cumsum( )は累積和を計算してくれます。毎日の売上データがあるときに、累積の売上を計算して、計画に対してどのくらい進捗しているの...
Python

Python初心者向け:文字列から括弧で囲まれた部分を抽出する

Python初心者でもわかるように、実際に正規表現を使って文字列の抽出をおこないます。これは実際の仕事の場で必要となった作業で、「」や『』で囲まれた部分をデータとして抽出するしょりとなります。このようなときに、正規表現が使えると簡単に処理をすることができます。
Python

Python基礎:rolling( )を使って移動平均を求める

はじめに 今回も事例列データを扱う際によく利用する処理をみていきます。rolling( )メソッドです。 rolling関数は窓関数と呼ばれるものを指定した要素の数の幅だけ適用する関数となっており、窓関数を適用することでそれぞれ...
Python

Python基礎:shift( )メソッド

はじめに 今回も時系列データを処理する際によく利用するものを見ていきましょう。pandasのshift( ) メソッドとrolling( )メソッドです。shift( )はデータをズラすことができます。通常、diff( )メソッドがあれ...