Python

pandas:データフレームからのデータ抽出

スポンサーリンク

はじめに

データの概要をつかむには列ごとのデータを取り出して集計したり、データの加工をする必要がある。今回は、データフレームからのデータ抽出操作について簡単にまとめる。ここでは、データ加工時に特に作業することが多い、列の抽出についてまとめます。

列項目だけではなく、条件に合致するデータだけを取りだしたり、行も列も指定したくなることもあります。そのような場合は、以下の投稿を参考にしてください。

df[“カラム名”]

まずは列へアクセスするときの基本形です。角括弧内で列名を指定します。角括弧内で列名を使うときには、必ずダブルクォーテーション(” “)で囲みます。この形式で取り出した時の戻り値は、pandasのSeriesとなります。

df[ [カラム番号] ]

列名ではなく、カラム番号で指定することもできます。この場合は、角括弧の中に角括弧でカラム番号を指定します。

df.カラム名

このように、より簡単に表現することができます。この表現では、ダブルクォーテーション無しで列名を指定することができますが、カラム名に空白を含んでいるとこの形を使うことがでません。

df[ [“カラム名”,”カラム名”,…] ]

複数のカラムを指定する場合は、角括弧の中に角括弧をいれてリストの形で指定します。列名ではなく、カラム番号で指定することもできます。この場合は、次のようになります。

コメント

タイトルとURLをコピーしました