▶ 統計学の初学者向けに記事を書いています。はじめから読む場合は以下をどうぞ
はじめに
統計学を学んだことがない初学者を対象にして、基本から解説しています。今回は「統計学と機械学習」を整理しましょう。統計学や機械学習を学んでいると、その違いって何だろう?と思うことはありませんか?機械学習の手法を学んでいて、あれ?統計学でもみたことあるな、とか、これは統計学なのか、機械学習なのか?など迷ったことがあるのではないでしょうか?
統計学と機械学習
まず、しっかりと機械学習を学ぼうとすると、「統計学」なくして機械学習や深層学習などは学べない、といえます。これは、たとえ線形回帰の場合でも、その係数に有意性があるのか?という問いには、当然「統計学」の知識が必要となってくるからです。そのため、機械学習を学ぶにしても、統計学が前提の知識となります。
分析手法により分類できるか
機械学習の前提知識、というだけではなく、統計学と機械学習の違いを説明することはできないのでしょうか?たとえば、分析手法でわけることはできないでしょうか?ただ、「決定木」による分類などは、統計学の文脈でも、機械学習の文脈でもでてきます。このように「手法」から説明するのは難しいそうです。
「目的」により分類できるか
次に、「目的」による違いがあるかを見てみましょう。これも難しそうです。統計学は現状を説明することを目的として、機械学種は予測することを目的とする、と聞いたことがあります。確かにそういう側面もあります。ただ、統計的手法で予測することもあるので、統計学は「現状を説明することが目的」とすると、ちょっと違和感を覚えます。
ただ、(いい方だけの問題かもしれませんが)、統計学・機械学習が「重視すること」としては次のことが言えるのではないでしょうか?
- 統計学
現状のデータ構造を可視化・解釈して示唆を得る
→解釈できること、説明できることを重視(※単純なアルゴリズムが好まれる) - 機械学習
徹底的に制度を追い求める
→予測精度を重視(※精度が高ければアルゴリズムが複雑でもよい)
このように解釈しておくと、完ぺきではないものの、ある程度しっくりくるのではないでしょうか?
まとめ
今回は「統計学」と「機械学習」の違いについて考えてみました。もともと「統計学」と「機械学習」の境目は曖昧な部分もある(むしろ重なる部分がある)ので、それぞれ重視することが違う、と考えておくとよいでしょう。
コメント