Python

Python

Python:列名の変更と値の変換

はじめに 今年の初めから、データ分析の流れをシリーズで掲載しています。前回までに データの読み込み 基本統計量など、基本的なデータの概要把握 データ型の変換 を扱いました。 データ型が正しくなければ、正しい分析はで...
Python

Python初心者向け:データ型の変換を基本から解説

Python初心者の方向けにデータ型を変換する方法を基本から解説します。文字列型→数値型、数値型→文字列型とする方法を説明した後、日付型→文字列型、文字列型→日付型とする方法を説明します。データを読み込んだ後はデータ型を確認して、適切な型で扱うようにしましょう。
Python

Python初心者向け:読み込んだデータをまず確認する方法をお伝えします

Python初心者の方でもわかるように、まずはデータを確認する方法をお伝えします。単純に読み込んだデータの先頭の数行や末尾の数行、各列のデータ型などを確認する方法を基本からお伝えします。最後に基本統計量をまとめて抽出する方法もご紹介します。
Python

Python初心者向け:データの読み込むときのいろんなパターンを解説

Python初心者の方でも迷わずにデータを読み込むことができるように基本から解説します。手元にあるデータはいつもきれいなデータとは限りません。先頭に不要な行があったり、列項目をすべて使う必要がない場合もあります。このようなデータの取り込みを例を使って説明します。
Python

Python:データをグループ化して処理する

はじめに データの概要を把握する過程やまたは分析する過程においても、グループ化はとても大切な手法となります。それは、グループごとに比較することで、あるグループの特徴的な部分を知ることができるからです。「特徴的な部分」を知ることができれば...
Python

Python:エディタの設定とエラーへの対処

はじめに 今回は、コーディングしていれば必ず遭遇するエラーについてです。エラーはどうやっても発生するものですが、単純なスペルミスなどはエディタの補完機能で避けることができます。また、発生したエラーの意味を知ることで、エラーをこだわらずに...
Python

Python:メールの送信時間と開封時間を調査する

はじめに 今回は、Pythonを使ってメルマガの送信時間と実際にお客様が開封した時間を見ていきましょう。やることは単純な手順ですが、ある程度の前処理が必要となります。順を追って説明します。 まずはデータを準備します。今回扱うのは次...
Python

Python初心者向け:リストを基本から解説

Python初心者の方向けに、基本となるデータ型であるリストについて基本から解説します。リストは数値や文字列などと同じデータ型の仲間です。複数のデータを並べて管理することができます。リストの作り方から、要素の追加・更新・削除の方法や使い方を説明します。
Python

Python:データ分析のための環境構築(Windows)

WindowsでPythonを使ったデータ分析をしたい方向けに、環境構築手順を一から解説します。ここに記載した手順通りにおこなえば、データ分析で必要とする標準的なパッケージもまとめて誰でも簡単にデータ分析環境を構築することができます。
Python

Python:結合の再確認

はじめに データ分析をしていると、複数のテーブルを結合して作業することがありますよね。今回は、pandasのデータフレームでテーブルデータを扱っているときに、直面する「結合」について扱います。 pandasライブラリのmergeに...
Python

Python:WebPageのアクセスログを集計するときの前処理

はじめに サイトのアクセス解析をするときには、通常、Google AnalyticsやAdobe Analyticsのような専用のツールを使うことが多いでしょう。(私はAdobe Analyticsは使ったことはありませんが)いろんなツ...
Python

Python初心者向け:2つのデータフレームの列を比較する

Python初心者の方向けに2つのデータフレームに共通する列項目を比較して、一方のデータフレームにはあるが、他方にはないものを抽出する方法を基本から解説します。これはisin( )メソッドを使うとものすごく簡単にできます。使う場面も多いので丁寧に解説していきます。
Python

Python:指定した文字列が含まれるかどうかをチェックする

Pythonでは「in」を使って指定した文字列が含まれるかチェックすることができます。今回はこの「in」の使い方を扱います。 やりたいこと 今回、この記事を書くきっかけになったのは、次のような作業をしていたときです。 ...
Python

pandas:データフレームからのデータ抽出

python初心者でもわかるようにデータフレームから必要な列項目だけを取り出す方法を解説します。実際のデータには不要なデータが含まれている方が普通です。番号での指定や列名での指定など、りろんあ指定方法のパターンを解説します。
Python

Python初心者向け:誰でもできるデータの概要を把握する方法をご紹介します。

Python初心者でも簡単にデータの概要を把握できるように基本から解説します。分析を始める前にデータの概要を把握することが大切です。やみくもにデータと向き合うのではなく、どのような特徴があるのか概要をつかむことで、データ分析の方針をたてることができます。
Python

Python初心者向け:csvファイルを読み込んだり書き出したりする手順

Python初心者の方向けに手元にあるcsvファイルのデータを読み込んだり、処理した後csvファイルに書き出す方法を基本から説明します。まずは細かなオプションは使わずに、pandasのread_csv( ) によるデータの読み込みから説明します。