仕事効率化

初学者向け:統計学と機械学習

スポンサーリンク
 
 

この記事はこんな方におススメです
  • データを分析をしたいが、どこから始めてよいかわからない方
  • データを仕事に活かしたいが、データの解釈の仕方がわからない方
  • 統計学を体系的に学んだことがない、初学者の方

▶  統計学の初学者向けに記事を書いています。はじめから読む場合は以下をどうぞ

はじめに

統計学を学んだことがない初学者を対象にして、基本から解説しています。今回は「統計学と機械学習」を整理しましょう。統計学や機械学習を学んでいると、その違いって何だろう?と思うことはありませんか?機械学習の手法を学んでいて、あれ?統計学でもみたことあるな、とか、これは統計学なのか、機械学習なのか?など迷ったことがあるのではないでしょうか?

統計学と機械学習

まず、しっかりと機械学習を学ぼうとすると、「統計学」なくして機械学習や深層学習などは学べない、といえます。これは、たとえ線形回帰の場合でも、その係数に有意性があるのか?という問いには、当然「統計学」の知識が必要となってくるからです。そのため、機械学習を学ぶにしても、統計学が前提の知識となります。

分析手法により分類できるか

機械学習の前提知識、というだけではなく、統計学と機械学習の違いを説明することはできないのでしょうか?たとえば、分析手法でわけることはできないでしょうか?ただ、「決定木」による分類などは、統計学の文脈でも、機械学習の文脈でもでてきます。このように「手法」から説明するのは難しいそうです。

「目的」により分類できるか

次に、「目的」による違いがあるかを見てみましょう。これも難しそうです。統計学は現状を説明することを目的として、機械学種は予測することを目的とする、と聞いたことがあります。確かにそういう側面もあります。ただ、統計的手法で予測することもあるので、統計学は「現状を説明することが目的」とすると、ちょっと違和感を覚えます。

ただ、(いい方だけの問題かもしれませんが)、統計学・機械学習が「重視すること」としては次のことが言えるのではないでしょうか?

  • 統計学
    現状のデータ構造を可視化・解釈して示唆を得る
    →解釈できること、説明できることを重視(※単純なアルゴリズムが好まれる)
  • 機械学習
    徹底的に制度を追い求める
    →予測精度を重視(※精度が高ければアルゴリズムが複雑でもよい)

このように解釈しておくと、完ぺきではないものの、ある程度しっくりくるのではないでしょうか?

スポンサーリンク

まとめ

今回は「統計学」と「機械学習」の違いについて考えてみました。もともと「統計学」と「機械学習」の境目は曖昧な部分もある(むしろ重なる部分がある)ので、それぞれ重視することが違う、と考えておくとよいでしょう。

コメント

タイトルとURLをコピーしました