python

Python

Python初学者向け:df[‘列名’]とdf[[‘列名’]]の違い~データフレームからのデータの抽出~

今回はデータフレームからデータを抽出するときの角括弧[ ]についてです。df['列名']とするときと、df[['列名']]とするときで返り値が異なります。これに戸惑ったことはありませんか?この記事を読み終えればもう迷うことはありません。早速解説していきましょう。
Python

LightGBMでモデル構築:特徴量の重要度を可視化する

▶ 初学者向けにデータ分析に関する記事を書いています はじめに LightGBMではモデルに使った特徴量の重要度を簡単に確認することができます。この重要度は、「各特徴量(各変数)がモデルの精度にどれだけ影響を与えた...
Python

LightGBMでモデル構築:カテゴリ変数を特徴量に加える

これまでTitanicのデータセットを使ってLightGBMでのモデル構築をしてきました。はじめは「Pclass」「Fare」を数値データとして扱い、この2つの特徴量のみでモデル構築をしていました。今回はLightGBMでカテゴリ変数を扱う方法を解説します。
Python

LightGBMでモデル構築:クロスバリデーションの場合

前回のLightGBMでのモデル構築は、始めて実装する方向けに特徴量は数値で3つのみ、ホールドアウト検証としていました。今回はクロスバリデーションの場合を確認していきましょう。基本的にはホールドアウト検証と同じですが、ループ処理が入ります。
Python

Python初学者向け:LightGBMでモデル構築~scikit-learn API編

前回はLightGBMを始めて使う際に戸惑うポイントを整理して、Training APIを使ったモデル構築をおこないました。今回はscikit-learn APIを使ったモデル構築を解説します。この記事を読み終えると、LightGBMでのモデル作成ができるようになります。
Python

Python初学者向け:LightGBMで戸惑うポイントを解説

今回はLightGBMを始めて使う方向けに、戸惑うポイントを整理しながら実際にLightGBMでのモデル構築をしていきましょう。今回は前処理や特徴量選択は最小限として、まず動くモデルを作ることを目的とします。この記事を読み終えると、LightGBMでのモデル作成ができるようになります。
Python

Python初学者向け:正規表現を利用した文字列の置換を基本から解説

今回は正規表現を用いた文字列の置換について基本から解説します。自分の理解もあいまいだったので、一度、基本的なことを整理してみようと思います。具体例を用いて試しながら解説するので、記事を読み終えると、正規表現を使った文字列の置換の仕方がわかり自らコードを書くことができるようになります。
Python

Python初学者向け:seabornのstyle設定の基本を解説

はじめに 今回はseabornのstyle設定の基本を解説します。seabornで設定することができるstyleをいくつかピックアップして設定方法をご紹介します。基本的によく使うもの以外は覚える必要がないので、こんなこと...
Python

Python初学者向け:seabornでHeatmapを描画する方法を基本から解説

今回はHeatmapの描画について基本から解説します。Heatmapは表の各値の大きさによって色分けして描画したものです。視覚的に値の大小や傾向を把握することができます。相関表や混同行列、ピボットテーブルでの集計結果などをヒートマップで表示すると、解釈しやすくなります。
Python

Python初学者向け:seabornのカテゴリ変数に関するプロットをまとめて紹介

今回はseabornのカテゴリ変数に関するプロットをまとめて紹介します。既に紹介したものを含めてまとめて整理しましょう。普段見慣れないプロットもありますが、カテゴリ変数を可視化するうえで非常に便利です。seabornでは簡単に描画できるので是非身につけましょう。
Python

Python初学者向け:seabornで変数間の相関を視覚的に捉える方法を基本から解説

相関係数などで変数間の関係を把握する方法もありますが、まずは可視化するのも有効な方法です。 今回はseabornを使って変数間の関係を視覚的に捉える方法をご紹介します。2変数間の関係をとらえるjointplotと各変数間の関係をとらえるpairplotを基本から解説します。
Python

Python初学者向け:seabornによる描画を基本から解説(ヒストグラム編)

数回にわたってseabornによる可視化を基本から解説します。今回はヒストグラムを扱います。既にmatplotlibで描画する方法を紹介していますが、seabornによる実装も確認しておきましょう。seabornはmatplotlibのラッパーライブラリで簡単な手順できれいな描画をすることができます。
Python

Python初学者向け:箱ひげ図を基本から解説

今回は箱ひげ図を取り扱います。これはデータのばらつきを見る際につかいます。前回、ヒストグラムを扱いましたが、箱ひげ図では複数のデータのばらつきを比較することができるので、こちらも是非押さえておきましょう。matplotlibで簡単に描くことができます。
Python

Python初学者向け:ヒストグラムと棒グラフを基本から解説

今回は分布を可視化する方法として、ヒストグラムと棒グラフの基本を解説します。データを手にしたらまずは各変数の基本統計量や分布を確認するとよいでしょう。分布の確認は可視化するのがいちばんわかりやすいです。さっそく見ていきましょう。
Python

Python初学者向け:複数のグラフを並べて描く方法を基本から解説

今回は複数のグラフを並べて描く方法を基本から解説します。グラフを重ねて描くこともありますが、並べて比較したいときもありますね。いくつかのやり方があるうえに、使用するメソッド名も似ているので混乱することもあると思います。今回はこれらを整理しましょう。
Python

Python初学者向け:散布図の描画を基本から解説

今回はmatplotlibで散布図を描く方法を基本から解説します。引数は必要な時に「Shift + Tab」でdocstringをみて確認すればよいので、全部覚える必要はありません。基本的な使い方と、どんなことができるかを抑えておけばよいでしょう。さっそく始めましょう。
Python

Python初学者向け:groupbyの処理結果を描画する方法を解説

今回はgroupbyでデータをグループ分けして処理した結果を描画してみましょう。データの概要を把握するときには、グループごとの特徴を把握するために集計しますよね。これを比較するときにただ値を見るだけでなく、可視化するとよりわかりやすくなります。
Python

Python初学者向け:matplotlibによる可視化を基本から解説

データの可視化を基本から解説していきます。まずはデータの可視化ライブラリmatplotlibの使い方からみていきます。今回は第一回目なので一番ベーシックな折れ線グラフの書き方から始めることにしましょう。
Python

Python初学者向け:ピボットテーブルを基本から解説します

今回はpandasのpivot_table()について基本を解説します。EXCELなどでデータ集計をするときによくおこなう操作なので、なじみ深い人も多いのではないでしょうか?ピボットテーブルはグループごとに集計して比較するときに使います。
Python

Python初学者向け:データフレームの繰り返し処理を基本から解説

▶ Pandasの基本を解説しています。Series/DataFrameの作り方は以下をご覧ください。 はじめに 今回はデータフレームのイテレーションについて基本から解説します。イテレーションとは簡単にい...
タイトルとURLをコピーしました