機械学習

Python

Python初心者向け:SQLiteを使う準備 ~データベースの作成~

Python初心者でもSQLiteが使えるように基本から解説していきます。前回、インストールしたDB Browser for SQLiteを使って、データベースを作成していきます。DB Browser for SQLiteはGUIなので直観的な操作で簡単に扱うことができます。
Python

Python初心者向け:DB Browser for SQLiteのインストール手順の解説

Python初心者でもデータベースのデータの読み書きができるように基本から解説します。ここではWindowsでSQLiteを扱うときに便利なGUIツールであるDB Browser for SQLiteのインストール手順を説明します。
Python

Python:pandas 20本ノックをやってみた

はじめに 今回は久しぶりにPythonの話題に戻って、テーブルデータの処理に必須となるpandasライブラリについて扱います。pandasはDataFrameの効率的な実装を提供してくれます。DataFrameでは行と列のラベルが付加され...
Python

Python初心者向け:sklearnでダミー変数の追加と二値化

Python初心者の方向けに、sklearnを用いた「ダミー変数の追加」と「二値化」を基本から解説します。ダミー変数の追加はadd_dummy_featureを使って作成します。二値化はbinarizeを用いて、指定した閾値より大きいか小さいかで二値化します。
Python

Python初心者向け:sklearnで正規化する方法を解説

Python初心者向けにsklearnライブラリを使った正規化の方法を基本から解説します。sklearnの前処理前処理を扱う機能(preprocessing)には、たくさんのメソッドがありますが、今回はこの中のscaleメソッドを用いた正規化を基本から解説します。
Python

Python初心者向け:sklearnで標準化する方法を解説

Python初心者向けにsklearnライブラリを使った標準化の方法を基本から解説します。sklearnの前処理前処理を扱う機能(preprocessing)には、たくさんのメソッドがありますが、今回はこの中のscaleメソッドを用いた標準化を基本から解説します。
Python

Python基礎:交差検証について

はじめに 前回はLightGBMを使用するときの手順を学びました。 このとき、Cross Validation(交差検証)に関しては、詳しい説明は省いたので、今回あらたに取り上げたいと思います。Scikitlearnを...
Python

Python初心者向け:LightGBMを実装する際の手順

Python初心者の方向けにLightGBMについて、基本的な部分からまとめます。データ量が多くても比較的高速で、精度もでるアルゴリズムなので、ぜひ使えるようになりましょう。パラメータが多いですが、できるだけわかりやすくまとめていきます。
Python

Python初心者向け:LightGBMを実装を基本から解説

Python初心者の方向けにLightGBMの実装を基本から解説します。irisとTitanicというい慣れた2つのデータセットでまずはLightGBMの実装に慣れてしまいましょう。この記事で誰でもLightGBMを試すことができます。
Python

Python初心者向け:決定木とランダムフォレストを可視化する

Python初心者の方向けに、ツリー系のアルゴリズムである決定木とランダムフォレストの可視化の方法を基本から解説します。サンプルデータで、まず決定木で分類をおこない次にランダムフォレストで分類して比較します。各特徴量の重要度の可視化もできるようになります。
Python

データ分析基礎:決定木

はじめに 今回は「決定木」を扱います。 決定木は結果の可読性が高いため非常に有用です。 機械学習に対する理解があまり得られていない職場でも、データを活用した施策の合意が得られやすいため、数あるアルゴリズムの中で決定木が選ばれることもあり...