Python

統計学:初学者向けに推測統計を基本から解説します

スポンサーリンク

 

この記事はこんな方におススメです
  • データを分析をしたいが、どこから始めてよいかわからない方
  • データを仕事に活かしたいが、データの解釈の仕方がわからない方
  • 統計学を体系的に学んだことがない、初学者の方

はじめに

統計学を学んだことがない初学者の方を対象にして基礎から解説しています。今回は「推測統計」を扱います。限られた標本から母集団の特徴を推測するのが「推測統計」です。母集団をすべて調べることはできないので、標本を分析して母集団を推測する、ということになります。今回の記事を読むことで、「推測統計」の概要を把握することができます。

記述統計と推測統計

まず、「記述統計」と「推測統計」について復習しておきましょう。簡単にいうと、「記述統計」の対象は「標本」であるのに対して、「推測統計」の対象は「母集団」となります。「記述統計」ではデータの特徴を代表値や散布度で表し、比較できるようにします。一方、「推測統計」は限られた「標本」から「母集団」を推測します。

▶ 「記述統計」「推測統計」の概要に関して復習する方は以下の記事をどうぞ

推測統計

母集団と標本

今回からは「母集団」のデータの特徴を「標本」から推測する「推測統計」を扱うことにします。まずは「母集団」「標本」を確認しておきましょう。

「標本」は母集団からの無作為抽出で作られます。無作為抽出というのはランダムに抽出する、ということです。このとき、完全にランダムに抽出するのは困難なので、できるだけランダムになるようにする、というのが現実的な対応となります。また、実務では「母集団」から「標本」を作り出すのではなく、既に「標本」がある場合は「標本」から無理のない範囲で「母集団」を設定します。「推測統計」は「標本」から「母集団」を推測するため、この「母集団」と「標本」の設計が肝となる。

用語の整理

「推測統計」ではあらたな用語がでてきます。はじめに整理しておきましょう。まず、分布の特徴を表す値を「統計量」といいます。ややこしいのですが、

  • 標本から計算された統計量(平均、分散、標準偏差など)を「標本統計量」という
    標本統計量は、標本平均、標本分散、標本標準偏差・・・のように表現します。
  • 母集団の統計量を「母数」という
    母数は、母平均、母分散、母標準偏差・・・のように表現します。

まとめ

ここまでをまとめておきましょう。

  • 「標本」は「母集団」から無作為に抽出して作られるのが基本となる
  • 既に「標本」がある場合は、無理のない範囲で「母集団」を設定する
  • 分布の特徴を表す値を「統計量」という
  • 標本から計算された統計量を「標本統計量」という
  • 母集団の統計量を「母数」という

特に赤線を引いた部分に注意が必要です。「標本」から「母集団」を推測する推測統計では、「標本」「母集団」の設定が重要となり、ここを間違えるとすべて意味のないものとなります。設定時には慎重におこなうようにしましょう。また、「母数」というのは「母集団の統計量」のことである点にも注意しましょう。

コメント

タイトルとURLをコピーしました