データ分析

Python

Python:メールの送信時間と開封時間を調査する

はじめに 今回は、Pythonを使ってメルマガの送信時間と実際にお客様が開封した時間を見ていきましょう。やることは単純な手順ですが、ある程度の前処理が必要となります。順を追って説明します。 まずはデータを準備します。今回扱うのは次のようなデ...
Python

Python初心者向け:リストを基本から解説

Python初心者の方向けに、基本となるデータ型であるリストについて基本から解説します。リストは数値や文字列などと同じデータ型の仲間です。複数のデータを並べて管理することができます。リストの作り方から、要素の追加・更新・削除の方法や使い方を説明します。
Python

Python:データ分析のための環境構築(Windows)

WindowsでPythonを使ったデータ分析をしたい方向けに、環境構築手順を一から解説します。ここに記載した手順通りにおこなえば、データ分析で必要とする標準的なパッケージもまとめて誰でも簡単にデータ分析環境を構築することができます。
Python

Python:結合の再確認

はじめに データ分析をしていると、複数のテーブルを結合して作業することがありますよね。今回は、pandasのデータフレームでテーブルデータを扱っているときに、直面する「結合」について扱います。 pandasライブラリのmergeについて確認...
Python

Python:WebPageのアクセスログを集計するときの前処理

はじめに サイトのアクセス解析をするときには、通常、Google AnalyticsやAdobe Analyticsのような専用のツールを使うことが多いでしょう。(私はAdobe Analyticsは使ったことはありませんが)いろんなツール...
Python

Python初心者向け:2つのデータフレームの列を比較する

Python初心者の方向けに2つのデータフレームに共通する列項目を比較して、一方のデータフレームにはあるが、他方にはないものを抽出する方法を基本から解説します。これはisin( )メソッドを使うとものすごく簡単にできます。使う場面も多いので丁寧に解説していきます。
Python

Python:指定した文字列が含まれるかどうかをチェックする

Pythonでは「in」を使って指定した文字列が含まれるかチェックすることができます。今回はこの「in」の使い方を扱います。 やりたいこと 今回、この記事を書くきっかけになったのは、次のような作業をしていたときです。 本部から支社に対して毎...
その他

【初心者限定】ggplotで思い通りのグラフを描く

ggplotライブラリを読み込む Rには標準でplot()で描画をすることが可能ですが、手軽に美しいグラフを描きたいのであれば、是非ggplot2を使ってください。まだインストールされていないのであれば、下のコマンドでインストール→ライブラ...
その他

R:データの読み書きをする

はじめに データを分析するには、まずデータを読み込む必要があります。これはどんなツールを使う場合でも共通ですね。Pythonの際にも同じような記事を書きました。pandas:データの読み書きをする Rでは、カンマ区切り形式だけでなく、スペー...
Python

pandas:データフレームからのデータ抽出

python初心者でもわかるようにデータフレームから必要な列項目だけを取り出す方法を解説します。実際のデータには不要なデータが含まれている方が普通です。番号での指定や列名での指定など、りろんあ指定方法のパターンを解説します。
Python

Python初心者向け:誰でもできるデータの概要を把握する方法をご紹介します。

Python初心者でも簡単にデータの概要を把握できるように基本から解説します。分析を始める前にデータの概要を把握することが大切です。やみくもにデータと向き合うのではなく、どのような特徴があるのか概要をつかむことで、データ分析の方針をたてることができます。
Python

Python初心者向け:csvファイルを読み込んだり書き出したりする手順

Python初心者の方向けに手元にあるcsvファイルのデータを読み込んだり、処理した後csvファイルに書き出す方法を基本から説明します。まずは細かなオプションは使わずに、pandasのread_csv( ) によるデータの読み込みから説明します。