python

Python

Python基礎:曜日の取り扱い

はじめに 今回はPythonで曜日を取り扱う方法を紹介します。データを集計しているときに、曜日ごとに集計して比較したくなることがありますよね。Webページのアクセス状況なども、妖美ごとに特徴があることが多いですよね。日付から簡単に曜日を算出...
Python

Python基礎:リスト内包表記

はじめに 今回はリスト内包表記を扱います。for文が使えればリスト内包表記という便利な気泡を使うことができます。リスト内包表記により、既存のリストからあらたなリストの作成を簡潔におこなうことができます。また、処理速度もはやいため是非ともみに...
Python

Python初心者向け:sklearnでダミー変数の追加と二値化

Python初心者の方向けに、sklearnを用いた「ダミー変数の追加」と「二値化」を基本から解説します。ダミー変数の追加はadd_dummy_featureを使って作成します。二値化はbinarizeを用いて、指定した閾値より大きいか小さいかで二値化します。
Python

Python初心者向け:対数変換について基礎から解説

Python初心者向けに対数変換を基本から説明します。Pythonで対数変換すること自体は簡単なのですが、そもそも対数変換する意味ってなんでしょう?まずは対数変換とは何かを整理したあと、pythonで対数変換をどのようにやるかを確認することにしましょう。
Python

Python基礎:テキストデータのカテゴリ化

はじめに 今回はテキストデータのカテゴリ化を扱います。たとえば、都道府県ごとにコードを割り振りたいなど、テキストデータをカテゴリ化する場面は意外に多いですよね。テキストデータのカテゴリ化は、一度map()を紹介した投稿の中で扱っていますが、...
Python

Python基礎:デバッグ

はじめに 今回はデバッグについて触れます。これまでPythonで遭遇するエラーに関しては、次の記事で扱っています。合わせて参照してください 前にエラーを扱った投稿では10個のエラーを紹介しましたが、今回はエラーを大きく3つにわけて紹介します...
Python

Python基礎:関数定義

はじめに 今回は関数定義を扱います。データ分析をしているときにも、繰り返しおこなう処理などは関数を定義しておいた方が楽なことが多いですよね。これまでの投稿でも、普通に関数を定義して使っていましたが、一度、まとめておきましょう(簡単です)。 ...
Python

Python初心者向け:関数を使って数値データをカテゴリ化する

Python初心者の方向けに関数を使って数値データをカテゴリ化する方法を基本から解説します。pandasには、cut( ) やqcut( )という数値データをカテゴリ化するためのメソッドがあらかじめ用意されています。今回はこのメソッドの使い方を基本から解説します。
Python

Python初心者向け:stack()/unstack()で行と列を自由に入れ替える

Python初心者の方向けに行と列を自由に入れ替える方法を基本から解説します。stackは「積む」という意味なので、stack/unstackは積んだり崩したりするということです。行方向に「積む」のか「崩す」のかと考えるとわかりやすいですね。
Python

Python初心者向け:数値データのカテゴリ化を基本から解説

Python初心者向けに数値データのカテゴリ化について基本から解説します。データを集計する際に各年齢をそのまま扱うよりも年代別のようにカテゴリ化したほうが、傾向がみやすくなることがあります。この記事をよむことで数値データをカテゴリとして扱う方法がわかります。
Python

Python初心者向け:分散/標準偏差を基本から解説します

Python初心者の方向けに分散と標準偏差について基本から説明します。分散には標本分散と不偏分散、標準偏差には標本標準偏差と不偏標準偏差とがあります。使うライブラリによってdefaultで計算するものが異なるので、これを意識して整理しておきましょう。
Python

Python基礎:query()メソッドについて

はじめに 今回は、query()メソッドを扱います。query()メソッドは、pandas.DataFrameのメソッドで、条件に合致したデータを取り出すときに使います。角括弧にブール値のリストを指定するよりも簡単に詳細な条件を指定すること...
Python

Python初心者向け:最頻値を基本から解説

Python初心者向けに最頻値を基本から解説します。最頻値は『一番出現頻度の高い値』のことです。シリーズを対象とする場合、データフレームを対象とする場合を例に解説します。最後にgある特徴量ごとに別の特徴量の最頻値を求める例を見ていきましょう。
Python

Python初心者向け:sklearnで正規化する方法を解説

Python初心者向けにsklearnライブラリを使った正規化の方法を基本から解説します。sklearnの前処理前処理を扱う機能(preprocessing)には、たくさんのメソッドがありますが、今回はこの中のscaleメソッドを用いた正規化を基本から解説します。
Python

Python初心者向け:sklearnで標準化する方法を解説

Python初心者向けにsklearnライブラリを使った標準化の方法を基本から解説します。sklearnの前処理前処理を扱う機能(preprocessing)には、たくさんのメソッドがありますが、今回はこの中のscaleメソッドを用いた標準化を基本から解説します。
Python

Python初心者向け:Jupyter notebookで変数一覧を表示する

Python初心者の方向けにJupyter notebookの設定について基本から解説します。データ分析をしていて、自分で設定した変数がわからなくなってしまうことないですか?そんなときに便利なのが、変数一覧を表示する機能です。誰でも簡単に設定することができます。
Python

Python基礎:Jupyter Notebookの使い方

はじめに 今回は、Pythonでデータ分析をするときに使うJupyterNotebookについて扱います。知っておくと便利なショートカットのうち、よく使うものだけをご紹介します。もちろん、ショートカットはたくさんあるので、今回ご紹介するもの...
Python

Python初心者向け:連続した日付リストの作り方を基本から解説

Python初心者の方向け向けに連続した日付のリストをつくる方法を基本から解説します。EXCELでデータを扱うときでも、今日までのデータが手元にあって、未来日の予想をすることがありますよね。そのときには、未来の日付のリストが欲しくなります。今回はこの方法を確認していきましょう。
Python

Python初心者向け:グラフのグリッド表示を基本から解説

Python初心者の方向けにグラフのグリッド表示を基本から解説します。グリッドの行と列に特徴ごとに分けられたグラフを作成するのに役立ちます。今回はPairGrid()、pairplot()、FacetGrid() の使い方をマスターしましょう。
Python

Python基礎:Numpy

はじめに 今回はNumpyを扱います。NumpyはPythonの数値計算ライブラリです。ベクトルや行列など、機械学習で必要となる形式のデータを簡単に扱うことができるようになります。基本的なことから順に一見て整理をしていくことにしましょう。 ...