▶ 初学者向けにPythonを使ったデータ分析に役立つ記事を書いています
はじめに
データ分析は、現代社会においてますます重要なスキルとなっています。そんな中、データ分析初心者にオススメしたいのが、「データ分析力を育てる教室」という本です。この本には数式やプログラミング言語は一切出てきません。「どうすれば、データ分析を通じて価値を生み出せるか?を教えてくれる本」です。早速紹介していきましょう。
構成
この本は次のような6章で構成されています。第一章で「データ分析とは何か」という部分を確認することから始まります。最後は「コミュニケーションとは何か」を確認したうえで、データ分析を通じて得られた示唆をしっかり伝えるために「伝わるコミュニケーション」で締めくくっています。
第一章:データ分析とは何だろう?
第二章:問いから始まる
第三章:仮説をつくる
第四章:観察と洞察
第五章:証明
第六章:伝わるコミュニケーション
良かった点
平易な文で書かれているので、読みやすくすらすら読むことができました。この本は数式もプログラミング言語もまったくでてきませんが、データ分析をする上での心構えや手順を学ぶことができます。
- データ分析は「意思決定」につながらなければ意味がない
- 「仮説が先、データが後」。仮説をもってデータを観察すること
というのはこの本の中でも何度か繰り返されるフレーズです。意思決定につながるものになっているか、仮説をもって取り組めているか、については常に意識しようと思いました。
データ分析の手順
データ分析の具体的な手順については、以下のように解釈しました。
1.解決すべき問題を解釈する
このとき、問題の解像度が低い場合は「問題の解像度」を上げる。この「問題の解像度」は因果関係を明らかにすることで明らかにすることができる
2.意思決定できるような「問い」を設定する
「意思決定できる」とは何をしなければいけないかが明確になっている状態で、この「意思決定」につながるような適切な「問い」を設定する必要がある。理想的には「問い」の解答そのものが問題を解決する意思決定につながる。
※知りたいだけのデータ分析ではなく、意思決定につながるデータ分析とする
3.仮説を作る
「問い」を作ったら、まずは仮でよいので「仮説」をつくる。この「仮説」づくりは「問い」の設定をした後、すぐに実行するとよい。また、仮説がデータで裏付けできそうか、あたりをつけておくとよいでしょう。
4.データ収集
仮説を作ったらデータ収集します。収集したデータを用いてさらに「仮説」を練り直すとよりよい分析となります。ここまでがデータ分析の前半のプロセスである、「仮説構築」プロセスです。
5.証明
ここからがデータ分析の後半のプロセスである、「仮説検証」プロセスです。仮説が真であることを証拠をもって説明することが「証明」です。証明には「論証」と「実証」があります。
6.意思決定
最後に意思決定です。「結果」だけを伝えるのではなく、「結論に至るまでの過程を丁寧に伝える」ことが大切です。
仮説について
推論の型
仮説については以下の3つが紹介されていました。
- 帰納法
様々な事象を観察し、事象から共通項を発見して結論に至る思考法 - 演繹法
普遍的かつ不変的な大前提を分析して、その前提に含まれている情報を解明して結論を導く思考方法 - アブダクション
事実に対して、整合性が取れる原因(前提)から、仮説を導く。このとき、どんなに驚くべき内容であったとしても、(整合性が取れる原因から導かれたのであれば)その仮説を採用する
仮説構築で大切なこと
仮説構築では徹底的にWHYにこだわることが大切。因果関係を整理して推論の型にはめることで仮説を生み出すことができる。
このようなことが書籍では詳しく解説されています。すらすら読めますが、なかなか1回では定着させることは難しいので、データ分析をする際に傍らにおいて、何度も読み直して実践を交えるとよいかと思います。
コメント