Python Jupyter LabでPlotlyのプロットを表示させる方法を基本から解説 今回は私がPlotly Expressという、簡単なコードでインタラクティブな可視化ができるライブラリを教えてもらって試したときに、「Jupyter Lab」ではエラーは出ないけど、真っ白な画面でプロットが表示されない、となってしまったため、その解決策をまとめたものとなります。 2022.10.18 Python
Python Python初学者向け:データフレームに行を追加する方法を基本から解説 今回はデータフレームにあらたに行を加える方法を基本から解説します。データフレームにデータを追加するときに、あれ?どうだったけ?ということはありませんか?行を追加する方法はいくつかありますが、今回はその中でもよく使う3つの方法を解説します。 2022.10.15 Python
Python Python初学者向け:str()とastype(str)について基本から解説 ▶ 初学者向けにデータ分析に関する記事を書いています はじめに 今回は組み込み関数であるstr()と型変換をするメソッドastype(str)について基本から解説していきます。皆さんは、これらの2つの違いが判りますか?わたしはこれらがごっち... 2022.10.07 2022.10.08 Python
Python Python初学者向け:df[‘列名’]とdf[[‘列名’]]の違い~データフレームからのデータの抽出~ 今回はデータフレームからデータを抽出するときの角括弧[ ]についてです。df['列名']とするときと、df[['列名']]とするときで返り値が異なります。これに戸惑ったことはありませんか?この記事を読み終えればもう迷うことはありません。早速解説していきましょう。 2022.09.17 Python
Python LightGBMでモデル構築:特徴量の重要度を可視化する ▶ 初学者向けにデータ分析に関する記事を書いています はじめに LightGBMではモデルに使った特徴量の重要度を簡単に確認することができます。この重要度は、「各特徴量(各変数)がモデルの精度にどれだけ影響を与えたか」を表します。初期値のま... 2022.09.17 Python
Python LightGBMでモデル構築:カテゴリ変数を特徴量に加える これまでTitanicのデータセットを使ってLightGBMでのモデル構築をしてきました。はじめは「Pclass」「Fare」を数値データとして扱い、この2つの特徴量のみでモデル構築をしていました。今回はLightGBMでカテゴリ変数を扱う方法を解説します。 2022.09.02 Python
Python LightGBMでモデル構築:クロスバリデーションの場合 前回のLightGBMでのモデル構築は、始めて実装する方向けに特徴量は数値で3つのみ、ホールドアウト検証としていました。今回はクロスバリデーションの場合を確認していきましょう。基本的にはホールドアウト検証と同じですが、ループ処理が入ります。 2022.09.02 Python
Python Python初学者向け:LightGBMでモデル構築~scikit-learn API編 前回はLightGBMを始めて使う際に戸惑うポイントを整理して、Training APIを使ったモデル構築をおこないました。今回はscikit-learn APIを使ったモデル構築を解説します。この記事を読み終えると、LightGBMでのモデル作成ができるようになります。 2022.08.24 2022.09.02 Python
Python Python初学者向け:LightGBMで戸惑うポイントを解説 今回はLightGBMを始めて使う方向けに、戸惑うポイントを整理しながら実際にLightGBMでのモデル構築をしていきましょう。今回は前処理や特徴量選択は最小限として、まず動くモデルを作ることを目的とします。この記事を読み終えると、LightGBMでのモデル作成ができるようになります。 2022.08.23 2022.11.15 Python
Python Python初学者向け:正規表現を利用した文字列の置換を基本から解説 今回は正規表現を用いた文字列の置換について基本から解説します。自分の理解もあいまいだったので、一度、基本的なことを整理してみようと思います。具体例を用いて試しながら解説するので、記事を読み終えると、正規表現を使った文字列の置換の仕方がわかり自らコードを書くことができるようになります。 2022.08.11 Python
Python Python初学者向け:seabornのstyle設定の基本を解説 はじめに 今回はseabornのstyle設定の基本を解説します。seabornで設定することができるstyleをいくつかピックアップして設定方法をご紹介します。基本的によく使うもの以外は覚える必要がないので、こんなことができるんだな程度に... 2022.08.08 Python
Python Python初学者向け:seabornでHeatmapを描画する方法を基本から解説 今回はHeatmapの描画について基本から解説します。Heatmapは表の各値の大きさによって色分けして描画したものです。視覚的に値の大小や傾向を把握することができます。相関表や混同行列、ピボットテーブルでの集計結果などをヒートマップで表示すると、解釈しやすくなります。 2022.08.08 Python
Python Python初学者向け:seabornのカテゴリ変数に関するプロットをまとめて紹介 今回はseabornのカテゴリ変数に関するプロットをまとめて紹介します。既に紹介したものを含めてまとめて整理しましょう。普段見慣れないプロットもありますが、カテゴリ変数を可視化するうえで非常に便利です。seabornでは簡単に描画できるので是非身につけましょう。 2022.08.07 Python
Python Python初学者向け:seabornで変数間の相関を視覚的に捉える方法を基本から解説 相関係数などで変数間の関係を把握する方法もありますが、まずは可視化するのも有効な方法です。 今回はseabornを使って変数間の関係を視覚的に捉える方法をご紹介します。2変数間の関係をとらえるjointplotと各変数間の関係をとらえるpairplotを基本から解説します。 2022.08.06 Python
Python Python初学者向け:seabornによる描画を基本から解説(ヒストグラム編) 数回にわたってseabornによる可視化を基本から解説します。今回はヒストグラムを扱います。既にmatplotlibで描画する方法を紹介していますが、seabornによる実装も確認しておきましょう。seabornはmatplotlibのラッパーライブラリで簡単な手順できれいな描画をすることができます。 2022.08.06 Python
Python Python初学者向け:箱ひげ図を基本から解説 今回は箱ひげ図を取り扱います。これはデータのばらつきを見る際につかいます。前回、ヒストグラムを扱いましたが、箱ひげ図では複数のデータのばらつきを比較することができるので、こちらも是非押さえておきましょう。matplotlibで簡単に描くことができます。 2022.08.05 2022.10.21 Python
Python Python初学者向け:ヒストグラムと棒グラフを基本から解説 今回は分布を可視化する方法として、ヒストグラムと棒グラフの基本を解説します。データを手にしたらまずは各変数の基本統計量や分布を確認するとよいでしょう。分布の確認は可視化するのがいちばんわかりやすいです。さっそく見ていきましょう。 2022.08.05 Python
Python Python初学者向け:複数のグラフを並べて描く方法を基本から解説 今回は複数のグラフを並べて描く方法を基本から解説します。グラフを重ねて描くこともありますが、並べて比較したいときもありますね。いくつかのやり方があるうえに、使用するメソッド名も似ているので混乱することもあると思います。今回はこれらを整理しましょう。 2022.08.03 Python
Python Python初学者向け:散布図の描画を基本から解説 今回はmatplotlibで散布図を描く方法を基本から解説します。引数は必要な時に「Shift + Tab」でdocstringをみて確認すればよいので、全部覚える必要はありません。基本的な使い方と、どんなことができるかを抑えておけばよいでしょう。さっそく始めましょう。 2022.08.03 Python
Python Python初学者向け:groupbyの処理結果を描画する方法を解説 今回はgroupbyでデータをグループ分けして処理した結果を描画してみましょう。データの概要を把握するときには、グループごとの特徴を把握するために集計しますよね。これを比較するときにただ値を見るだけでなく、可視化するとよりわかりやすくなります。 2022.08.02 Python