2020-01

Python

Python:欠損値の取り扱い

はじめに Pandasでは、欠損値NaNがあるデータを扱っても基本的にはエラーとはなりませんが、処理結果がNaNになることが多いです。一部の関数では、NaNを除いて処理をおこない、結果を返してくれるものもありますが、基本的には処理前に欠...
Python

Python:データから情報を取り出す

はじめに データ分析の流れを説明するシリーズで、「データの概要把握」のプロセスに関する記事を書いています。「データの概要把握」のプロセスでは、これまで、データの読み込みから始めて、データの確認、データ型の変換、列名の変更と値の変換、条件...
Python

Python初心者向け:条件に応じて代入する値を変える方法を解説

Python初心者の方でも簡単に、条件に応じて値を代入する方法を基本から解説します。今回は、ブールインデックスとwhere( )メソッドを使う方法を基本からお伝えします。この投稿をみていただくことで、条件式をにより代入する値をかえることができるようになります。
Python

Python:列名の変更と値の変換

はじめに 今年の初めから、データ分析の流れをシリーズで掲載しています。前回までに データの読み込み 基本統計量など、基本的なデータの概要把握 データ型の変換 を扱いました。 データ型が正しくなければ、正しい分析はで...
Python

Python初心者向け:データ型の変換を基本から解説

Python初心者の方向けにデータ型を変換する方法を基本から解説します。文字列型→数値型、数値型→文字列型とする方法を説明した後、日付型→文字列型、文字列型→日付型とする方法を説明します。データを読み込んだ後はデータ型を確認して、適切な型で扱うようにしましょう。
Python

Python初心者向け:読み込んだデータをまず確認する方法をお伝えします

Python初心者の方でもわかるように、まずはデータを確認する方法をお伝えします。単純に読み込んだデータの先頭の数行や末尾の数行、各列のデータ型などを確認する方法を基本からお伝えします。最後に基本統計量をまとめて抽出する方法もご紹介します。
Python

Python初心者向け:データの読み込むときのいろんなパターンを解説

Python初心者の方でも迷わずにデータを読み込むことができるように基本から解説します。手元にあるデータはいつもきれいなデータとは限りません。先頭に不要な行があったり、列項目をすべて使う必要がない場合もあります。このようなデータの取り込みを例を使って説明します。
その他

Python:データ分析の流れ

はじめに 今回は、分析を行う際の進め方について書きます。「このようにやれば絶対OK」というようなものはありませせんが、基本的な考え方を確認していきましょう。今回は全体の流れを説明して今後は各プロセスの詳細について投稿を追加していくことに...
Python

Python:データをグループ化して処理する

はじめに データの概要を把握する過程やまたは分析する過程においても、グループ化はとても大切な手法となります。それは、グループごとに比較することで、あるグループの特徴的な部分を知ることができるからです。「特徴的な部分」を知ることができれば...