データ分析

Python

統計学:初学者向けに統計的仮説検定を解説します

今回は「統計的仮説検定」を扱います。まず仮説を立て、仮説が正しいかを統計的に判断することをいいます。基本的な検定を紹介したあと、統計的仮説検定の流れまで説明します。この記事を読むことで、検定をどのようなものに適用できるか、どのようは手順でおこなうかがわかるようになります。
Python

統計学:初学者向けにPythonでt分布を扱う方法を基本から解説します

今回は「t分布」について扱います。t分布は標準化をおこなった際に母分散を不偏分散で代用した時の分布です。はじめにt分布のパラメータの確認をおこない、次に(近似をせずに)Pythonでt分布から直接、平均の区間推定する方法を解説します。
Python

統計学:初学者向けに「推定」について基本から解説します

今回は「推定」について扱います。統計学は大きく2つに分けると「記述統計」と「推測統計」に分かれます。「推測統計」は「推定」と「検定」に分かれます。今回は比率の区間推定、平均の区間推定の順に解説し、最後にPytyonで確認することにしましょう。
2022.01.15
Python

統計学:初学者向けにPythonで不偏分散を算出する方法を解説

今回は、「不偏分散」をPythonで求める手順を基本から解説していきます。母数を推定するのに使う統計量を「推定量」と呼ぶのでしたね。推定量の中には、不偏性を持つもの/持たないものとがあります。標本分散は不偏性を持たないため、母分散の推定量としては「不偏分散」を使います。
Python

統計学:初学者向けに母数の推定を基本から解説

今回は「母数の推定」について基本から解説していきます。推測統計の興味の対象は「母集団」でしたね。母集団を調査することはできないから「標本」から「母集団」を推定します。「母集団」の統計量のことを母数と表現するので、「母数の推定」をすることになります。
Python

統計学:初学者向けに推測統計を基本から解説します

今回は「推測統計」を扱います。限られた標本から母集団の特徴を推測するのが「推測統計」です。母集団をすべて調べることはできないので、標本を分析して母集団を推測する、ということになります。今回の記事を読むことで、「推測統計」の概要を把握することができます。
2022.01.09
Python

統計学:初学者向けに二項分布を基本から解説

今回は確率分布の一つとである「二項分布」を扱います。二項分布はいろいろな確率分布の基礎となる分布であり、正規分布をこの二項分布から派生したものです。二項分布はどんなものであるかの解説から初めて、Pythonでの実装までみていきましょう。
Python

統計学:初学者向けに標準化を基本から解説します

今回は「標準化」を扱います。データを集めたあと、その値が大きいのか、小さいのかを判断したくても、「尺度」が揃ってないと比較もできません。「標準化」をすることによって尺度をそろえ、比較することができます。標準化の定義を確認し、Pythonでの実装方法まで確認していきましょう。
Python

統計学:初学者向けにPythonで正規分布を扱う方法を基本から解説

今回は統計学ではおなじみの正規分布を確認していきましょう。正規分布はガウスが発見したので、ガウス分布とも呼ばれます。この正規分布は自然界でも多く見られ、統計学の分野でもよく使われる分布です。まずは定義から確認してPythonで確かめていくことにしましょう。
Python

統計学:初学者向けにPythonで累積分布関数を実装する方法を解説します

今確率変数が連続変数である場合、確率密度関数によって確率密度を表します。「区間」を指定すると確率が定まるのでしたね。確率密度関数を区間で積分すれば確率を求められますが、「累積分布関数」を使うともっと簡単に確率を求めることができます。今回はPythonでこれを確かめていきましょう。
2021.12.31
Python

統計学:初学者向けに確率密度を基本から解説します

今回は確率密度と確率について説明をします。離散型確率変数の分布を表す「確率質量関数」では縦軸が直接、確率を表すのに対して、連続型確率変数の分布を表す「確率密度関数」では描く面積が確率となります。面積を求めるには「累積分布関数」を導入する便利です。この順に解説をしていきます。
Python

統計学:初学者向けにPythonによる確率分布の取り扱いを基本から解説

今回は確率分布を扱います。確率変数、確率分布の順に解説し、最後にPythonによる実装をおこないます。この投稿を最後まで読むと確率分布とは何かがわかり、実際にPythonでコードをかけるようになります。
Python

Python初心者向け:seabornの学習用データセットの使い方を基本から解説

データ分析の学習を進めていると、実際にデータを使って試してみたくなることがあるでしょう。サンプルデータを一から作るのは大変です。ぜひ、学習用に用意されたデータセットを使ってみてください。この記事を読むと、Seabornの学習用データセットを扱うことができるようになります。
Python

統計学:初学者向けにPythonで$\rm{\chi^{2}}$値と期待度数を求める方法を基本から解説

この記事はこんな方におススメです データを分析をしたいが、どこから始めてよいかわからない方データを仕事に活かしたいが、データの解釈の仕方がわからない方統計学を体系的に学んだことがない、初学者の方 はじめに 統計学を学んだ...
Python

統計学:初学者向けに相関係数について基本から解説します

今回は、「相関係数」をを基本から解説します。連続する変数間の相関関係の強さを表すものとして「共分散」がありますが、これは変数ごとに大きさがまちまちとなり、単純に比較できません。そこで、相関の強さを標準化した「相関係数」が使われます。今回の記事を読めば、Pythonで相関係数を求めることができるようになります。
Python

統計学:初学者向けにPythonによる散布度の求め方を基本から解説します

統計学を学んだことがない方を対象に基本から解説しています。今回は、「散布度」をPythonで求める手順を基本から扱います。範囲、四分位数、平均偏差、分散、標準偏差の順に扱っていきます。記事を最後まで読むことで、これらの散布度を簡単にPythonで算出できるようになります。
2021.12.25
Python

統計学:分布の描画方法を初学者向けに基本から解説します

統計学を学んだことがない方を対象に基本から解説しています。今回はデータを入手したらまず最初におこなう「分布」の確認についてです。分布を確認するにあたり、連続変数の場合とカテゴリ変数の場合に分けて、Pythonによる可視化の方法を基本から解説します。
2021.12.25
Python

統計学:初学者向けにPythonによる代表値の求め方を基本から解説します

統計学を学んだことがない方を対象に基本から解説しています。今回は、前回扱った「代表値」をPythonで求める手順を基本から解説していきます。平均値、中央値、最頻値の順に扱っていきます。記事を最後まで読むことで、これらの代表を簡単にPythonで算出できるようになります。
2022.01.08
Python

統計学:初学者向けに記述統計(代表値と散布度)を基本から解説します

統計学を学んだことがない初学者を対象にして、基礎から解説していきます。第一回目は記述統計を扱います。記述統計では代表値と散布度の取り扱いに分けて解説していきます。この投稿を最後まで読むと記述統計とは何かがわかり、実際にPythonでコードをかけるようになります。
2022.01.04
Python

Python初心者向け:pandasの表示設定の変更を基本から解説

pandasではオプションの設定を変更することで、表示のカスタマイズが可能です。設定変更をして、自分好みの動作や表示を手に入れましょう。今回は属性にアクセスして、その設定を変更する方法をご紹介します。まずはどんな設定項目があるのから確認していきましょう。
2021.11.18
タイトルとURLをコピーしました