その他

R:データの読み書きをする

スポンサーリンク

はじめに

データを分析するには、まずデータを読み込む必要があります。これはどんなツールを使う場合でも共通ですね。Pythonの際にも同じような記事を書きました。pandas:データの読み書きをする

Rでは、カンマ区切り形式だけでなく、スペース区切り形式やタブ区切り形式のファイルも読み込むことができますが、ここでは最も基本的なcsvファイルの読み込みについてのみ説明します。Rでのデータの読みだし、書き出しははR標準の機能でよいでしょう。

csvデータのインポート

基本形 read.csv(“ファイル名.csv”)

まずは基本形です。csv形式のファイルであることがわかっていれば、ファイルの拡張子はcsvである必要はありません。ファイル名.txtでも読み込むことができます。read.csv()メソッドは、デフォルトでは1行目をheaderとして取り込みます。header行が不要な場合は、headerオプションでFalseを指定します。文字コードを指定する場合は、fileEncodingオプションを使います。

また、Rでは文字列が自動的にfactor型になるので、これでは不都合である場合はstringsAsFactorsオプションでFalseを指定すると、String型として取り込むことができます。

csvデータのエクスポート

基本形 write.csv(df,”ファイル名.csv”)

これでcsvファイルに書き出すことができますが、1つ注意が必要です。write.csv()はwrite.table()のwrapperであり、write.table()に渡す引数を限定しています。具体的には、

  1. append,col.names,sep,dec,qmethodは変更できない
  2. sep=”,”で固定
  3. dec=”.”で固定
  4. col.names=NA
  5. qmethod=”double”で固定

となっています。row.namesに関しては、デフォルトではTRUEとなっており、左端に出力されるのでこれが好ましくない場合は、Falseを指定するとよいでしょう。

スポンサーリンク

コメント

タイトルとURLをコピーしました