データ分析

EXCEL

EXCEL:パワークエリーで複数のシートのデータを結合する方法を基本から解説

今回はEXCELのファイルの複数のシートに分かれているデータを取り込んで一つにまとめる方法を基本から解説します。このような処理もパワークエリを使うと非常に簡単にできます。本当に便利になりましたね。では、早速取り掛かっていきましょう。
Python

Python初学者向け:文字列の一部を置き換える方法を基本から解説

▶ Python初学者向けにデータ分析に関する記事を書いています はじめに 今回はデータフレームのある特定の列の文字列データを置き換える方法を基本から解説します。値を丸ごと置き換える場合はreplace()メソッド...
Python

Python初学者向け:行と列が入れ替わったデータを読み込む方法を基本から解説

▶ Python初学者向けにデータ分析に関する記事を書いています はじめに 今回はもらったデータが行・列が入れ替わっていた場合の対処方法を基本から解説します。手元のデータが行・列が逆なんだよなぁ、といった経験はない...
Python

Python初学者向け:pandas⇔SQLiteのデータのやりとりを基本から解説

データベースと聞くと難しそう?と思いませんか?これまでSQLiteにデータベースやテーブルを作成する方法を紹介してきましたが、pandasで処理したデータフレームをそのままSQLiteに渡すこともできます。これだとデータベースのハードルもぐんとさがるのではないでしょうか?今回はPythonとSQLiteのデータのやりとりについて基本から解説します。
EXCEL

EXCEL:ピボットテーブルで値フィールドに文字列を表示させる方法を基本から解説

通常、ピボットテーブルは集計なので合計や個数などの数値データとなります。ただ、値がテキストデータであるときにそのまま表示させたいことはないですか?今回はピボットテーブルに文字列をそのまま表示させる方法を基本から解説します。
EXCEL

EXCEL:ピボットテーブルで累計を計算する方法を基本から解説します

今回はピボットテーブルを使った集計時に「累計」の列を加える方法を基本から解説します。ピボットテーブルでは累計の計算も簡単にできます。でも、やり方を知らないとなかなか難しいですよね。 基本から確認していきましょう。また、集計の途中でレポートの整形なども解説します。
EXCEL

EXCEL:ピボットテーブルで集計したデータを指定した順に並び替える方法を基本から解説

今回はピボットテーブルを使って集計したときの「月」の列の並び替えの方法を基本から解説します。日付ごとのデータをピボットテーブル集計すると自動で月ごとのグループにしてくれます。ただ、1月から始まって12月まで並んでいて困ったことはありませんか?年度でみるときは4月~翌3月までで並べたいことがあります。今回はそのやり方を基本から解説します。
EXCEL

EXCEL:パワークエリで簡単に縦持ち⇔横持ちデータの変換する方法を解説(ピボットとピボット解除)

EXCELでデータを集計しているときに縦持ちデータを横持データにしたい、あるいは、逆に横持データを縦持ちデータにしたい、ということはないですか?今回はパワークエリを使って縦持ち、横持ちを入れ替える方法を基本から解説します。
Python

Python初学者向け:文字列メソッドで0パディングする方法を基本から解説

今回は、桁数が異なる値の時に0で埋めることで桁数を揃える「0パディング」する方法を基本から解説します。通常、左側を0で埋めることが多いですが、桁数を指定して左寄せ・中央寄せ・右寄せで0埋めすることもできます。順番にみていきましょう。
Python

Python初学者向け:Visual Studio Codeのインストールと拡張機能の設定を基本から解説

今回はMicroSoftが提供する、便利なコードエディタ Visual Studio Code(略してVS Codeとも呼ばれます)のインストールと拡張機能の設定の仕方を解説します。この記事を読み進めることで、Pythonでコードを書く環境をつくることができます。
Python

Python初学者向け:pandasのplot関数による可視化を基本から解説

今回はpandasのplot関数を基本から解説します。Pythonで可視化するときに真っ先に思いつくのはmatplotlibかと思いますが、pandasのplot関数はこのmatplotlibのラッパーの位置づけです。かなり簡単に可視化ができるので是非使い方を覚えましょう。
Python

Python初学者向け:仮想環境をワンクリックで開く設定を基本から解説

今回は、前回の投稿で作成したPythonの仮想環境を素早く簡単に開く設定を基本から解説します。仮想環境があると、いま使っている環境を変えずに新しいライブラリを試すことができて便利ですよね。ただ、仮想環境を開くのが面倒くさい、という人におススメの設定です。
Python

Jupyter LabでPlotlyのプロットを表示させる方法を基本から解説

今回は私がPlotly Expressという、簡単なコードでインタラクティブな可視化ができるライブラリを教えてもらって試したときに、「Jupyter Lab」ではエラーは出ないけど、真っ白な画面でプロットが表示されない、となってしまったため、その解決策をまとめたものとなります。
Python

Python初学者向け:データフレームに行を追加する方法を基本から解説

今回はデータフレームにあらたに行を加える方法を基本から解説します。データフレームにデータを追加するときに、あれ?どうだったけ?ということはありませんか?行を追加する方法はいくつかありますが、今回はその中でもよく使う3つの方法を解説します。
Python

Python初学者向け:str()とastype(str)について基本から解説

▶ 初学者向けにデータ分析に関する記事を書いています はじめに 今回は組み込み関数であるstr()と型変換をするメソッドastype(str)について基本から解説していきます。皆さんは、これらの2つの違いが判ります...
Python

Python初学者向け:df[‘列名’]とdf[[‘列名’]]の違い~データフレームからのデータの抽出~

今回はデータフレームからデータを抽出するときの角括弧[ ]についてです。df['列名']とするときと、df[['列名']]とするときで返り値が異なります。これに戸惑ったことはありませんか?この記事を読み終えればもう迷うことはありません。早速解説していきましょう。
Python

LightGBMでモデル構築:特徴量の重要度を可視化する

▶ 初学者向けにデータ分析に関する記事を書いています はじめに LightGBMではモデルに使った特徴量の重要度を簡単に確認することができます。この重要度は、「各特徴量(各変数)がモデルの精度にどれだけ影響を与えた...
Python

LightGBMでモデル構築:カテゴリ変数を特徴量に加える

これまでTitanicのデータセットを使ってLightGBMでのモデル構築をしてきました。はじめは「Pclass」「Fare」を数値データとして扱い、この2つの特徴量のみでモデル構築をしていました。今回はLightGBMでカテゴリ変数を扱う方法を解説します。
Python

LightGBMでモデル構築:クロスバリデーションの場合

前回のLightGBMでのモデル構築は、始めて実装する方向けに特徴量は数値で3つのみ、ホールドアウト検証としていました。今回はクロスバリデーションの場合を確認していきましょう。基本的にはホールドアウト検証と同じですが、ループ処理が入ります。
Python

Python初学者向け:LightGBMでモデル構築~scikit-learn API編

前回はLightGBMを始めて使う際に戸惑うポイントを整理して、Training APIを使ったモデル構築をおこないました。今回はscikit-learn APIを使ったモデル構築を解説します。この記事を読み終えると、LightGBMでのモデル作成ができるようになります。
タイトルとURLをコピーしました