はじめに
データの概要をつかむには列ごとのデータを取り出して集計したり、データの加工をする必要がある。今回は、データフレームからのデータ抽出操作について簡単にまとめる。ここでは、データ加工時に特に作業することが多い、列の抽出についてまとめます。
列項目だけではなく、条件に合致するデータだけを取りだしたり、行も列も指定したくなることもあります。そのような場合は、以下の投稿を参考にしてください。
df[“カラム名”]
まずは列へアクセスするときの基本形です。角括弧内で列名を指定します。角括弧内で列名を使うときには、必ずダブルクォーテーション(” “)で囲みます。この形式で取り出した時の戻り値は、pandasのSeriesとなります。
df[ [カラム番号] ]
列名ではなく、カラム番号で指定することもできます。この場合は、角括弧の中に角括弧でカラム番号を指定します。
df.カラム名
このように、より簡単に表現することができます。この表現では、ダブルクォーテーション無しで列名を指定することができますが、カラム名に空白を含んでいるとこの形を使うことがでません。
df[ [“カラム名”,”カラム名”,…] ]
複数のカラムを指定する場合は、角括弧の中に角括弧をいれてリストの形で指定します。列名ではなく、カラム番号で指定することもできます。この場合は、次のようになります。
コメント