Python

Python

Python基礎:重複データの取り扱い

はじめに はじめて扱うデータや自分の複数のテーブルを組み合わせた場合は、重複データの確認をおこなうようにしましょう。重複データが生じる要因は様々でです。単純にデータが重複している場合もあれば、人的ミスによる場合もあります。pandasのシリ...
Python

Python基礎:交差検証について

はじめに 前回はLightGBMを使用するときの手順を学びました。 このとき、Cross Validation(交差検証)に関しては、詳しい説明は省いたので、今回あらたに取り上げたいと思います。Scikitlearnを利用することで簡単に交...
Python

Python初心者向け:LightGBMを実装する際の手順

Python初心者の方向けにLightGBMについて、基本的な部分からまとめます。データ量が多くても比較的高速で、精度もでるアルゴリズムなので、ぜひ使えるようになりましょう。パラメータが多いですが、できるだけわかりやすくまとめていきます。
Python

Python初心者向け:LightGBMを実装を基本から解説

Python初心者の方向けにLightGBMの実装を基本から解説します。irisとTitanicというい慣れた2つのデータセットでまずはLightGBMの実装に慣れてしまいましょう。この記事で誰でもLightGBMを試すことができます。
Python

Python初心者向け:決定木とランダムフォレストを可視化する

Python初心者の方向けに、ツリー系のアルゴリズムである決定木とランダムフォレストの可視化の方法を基本から解説します。サンプルデータで、まず決定木で分類をおこない次にランダムフォレストで分類して比較します。各特徴量の重要度の可視化もできるようになります。
Python

東京都のコロナウィルス感染者数について~データを眺める~

はじめに 今回も東京都のコロナウィルス感染者数のデータを扱うことにしましょう。今回はpandasを使うことにします。pandas_profilingを使ってデータを眺めて、次にいくつかの描画をすることにします。 データの取得の仕方については...
Python

東京都のコロナウィルスの感染者数について~移動平均をプロット~

はじめに 前回に引き続き、東京都のコロナウィルスの感染者数のデータを扱います。今回もpandasを使わずに扱う場合と、pandasを使って扱う場合の2通りでやってみましょう。前回は日々の新規感染者数の変化をプロットしましたが、これでは傾向が...
Python

東京都のコロナウィルス感染者数について

はじめに 今回は実際に東京都のWebページで公開されている、コロナウィルス感染者数の推移を可視化してみます。いままでpandasを使っていろんな処理をしてきましたが、今回は、「pandasを使わずに処理」と「pandasを使って処理」の両方...
Python

データ分析基礎:決定木

はじめに 今回は「決定木」を扱います。 決定木は結果の可読性が高いため非常に有用です。 機械学習に対する理解があまり得られていない職場でも、データを活用した施策の合意が得られやすいため、数あるアルゴリズムの中で決定木が選ばれることもあります...
Python

Python初心者向け:データの可視化の方法を基本からまとめました

データ分析の初心者にもわかるように、データの可視化の方法を基本から丁寧に解説します。この記事を読むことで、グラフを描く基本的な方法が理解でき、多くのグラフを描くことができ量になります。matplotlibとseabornライブラリを使った可視化を解説します。
Python

Python基礎:ファイルを読み込んでデータベースに登録する

はじめに 今回も「Pythonからデータベースを操作する」の続きです。PythonからSQL文を発行する方法を学んだので、データベースにデータを連続で登録する、条件に合致したデータを抽出することができるようになりました。今回は、手元にあるフ...
Python

Python初心者向け:データベースからデータを抽出する基本を解説

Python初心者でもわかるようにMySQLに接続し、指定した条件に合致するデータを抽出する方法を基本から解説していきます。データの抽出は、select文でしたね。PythonからはどのようにSQL文を実行するのかを実際に確認してみましょう。
Python

Python基礎:データベースを操作する

はじめに 前回に引き続き、データtベースを扱います。今回は、直接操作するのではなく、PythonからMySQLを操作してみます。PythonからのMySQLの操作には、mysqlclientを利用します。まずはこれを導入するところから始めま...
Python

Python基礎:クラスについて

はじめに 今回もPython基礎を扱います。テーマはクラスです。独学で学ぶ時のつまづきポイントではないでしょうか?私も、はじめちんぷんかんでした。こういうのは、実際に手を動かして試してみるのが良いですね。まずは、オブジェクトとクラスの概要を...
Python

Python基礎:ファイルの扱い方

はじめに 今回もPython基礎です。ファイル操作を扱います。実はずっと苦手にしていたので、一度整理したかったの良い機会です。「みんなのPython」(SB Creative)からの引用です。 Pythonではファイルを操作するためには、o...
Python

Python初心者向け:辞書型 ~演習問題と解答~

Python初心者の方向けに辞書型の演習問題をつくってみました。辞書型を使った処理では、キーが存在するかどうかに気を付けて処理を行う必要があります。存在しないキーを使って辞書の要素を参照しようとすると、例外が発生するため注意が必要です。丁寧に基本から解説します。
Python

Python基礎:リストのリスト

はじめに 今回も「Python基礎」です。リストは複数の要素を並べて管理したものです。リストの要素はリストでもよく、この場合階層を持つことになります。ただ数字が並んでいるだけだとわかりやすくかったリストが、階層を持つと一気にイメージしにくく...
Python

Python基礎:リストの並び替え

はじめに 今回も「Python基礎」です。僕自身の知識があやふやな部分を扱って、整理していきます。今回はリストの並び替えです。sort()だっけ?sorted()だっけ?元のリストは書き換わるのか?書き換わらないのか?とごっちゃになることは...
Python

Python基礎:%演算子

はじめに 今回も前回に引き続き、「Python基礎」を扱います。今回は%演算子です。これは書式化演算子とも呼ばれます。変数に値を格納して、print文で表示するとき、文字列とどうやって組み合わせるか悩んだことはありませんか?(こんなところで...
Python

Python初心者向け:演習問題(if文・リスト・辞書型)にチャレンジ

Python初心者の方向けに、演習問題を用意しました。この問題にチャレンジすることで、これまでに学んだことが問題を解決するのに役立つことを体感できます。また、これまで学んだリスト・辞書・if文を使って、1つの問題をいろんなコードで解決しましょう。