2022-09

Python

Python初学者向け:df[‘列名’]とdf[[‘列名’]]の違い~データフレームからのデータの抽出~

今回はデータフレームからデータを抽出するときの角括弧[ ]についてです。df['列名']とするときと、df[['列名']]とするときで返り値が異なります。これに戸惑ったことはありませんか?この記事を読み終えればもう迷うことはありません。早速解説していきましょう。
Python

LightGBMでモデル構築:特徴量の重要度を可視化する

▶ 初学者向けにデータ分析に関する記事を書いていますはじめにLightGBMではモデルに使った特徴量の重要度を簡単に確認することができます。この重要度は、「各特徴量(各変数)がモデルの精度にどれだけ影響を与えたか」を表します。初期値のまま使...
Python

LightGBMでモデル構築:カテゴリ変数を特徴量に加える

これまでTitanicのデータセットを使ってLightGBMでのモデル構築をしてきました。はじめは「Pclass」「Fare」を数値データとして扱い、この2つの特徴量のみでモデル構築をしていました。今回はLightGBMでカテゴリ変数を扱う方法を解説します。
Python

LightGBMでモデル構築:クロスバリデーションの場合

前回のLightGBMでのモデル構築は、始めて実装する方向けに特徴量は数値で3つのみ、ホールドアウト検証としていました。今回はクロスバリデーションの場合を確認していきましょう。基本的にはホールドアウト検証と同じですが、ループ処理が入ります。