大学4年間の統計学が10時間でざっと学べるを読んだ感想

みなさんこんばんは。

 

今回は大学4年間の統計学が10時間でざっと学べるを読んだ感想です。

以前、製薬系の研究所で働いていた時に、統計を使うことがありました。仕事で使う際には理解せず何となく統計を用いていたのが、今は気持ち悪く感じているため、再度統計学を学習し直すために読みました。

 

以下、書籍より引用した文章については下記のボックスで囲みます。

著者は?

著者は倉田博史氏です。

東京大学大学院総合文化研究科・教養学部の教授です。

 

印象に残った内容は?

データ分布の散らばりの指標(標準偏差)

分散は元のデータとは異なった単位を持ちますので、その値を解釈するときにしばしば不便です。そこで、元のデータと同じ単位にするため分散の平方根を取ることが考えられます。分散の(正の)平方根を標準偏差と言います。

分散でもデータのばらつきを表現できますが、単位の関係上、標準偏差にすることで、値との単位の整合性をとることができます。

こんなことも、すっかり記憶から抜け落ちていたので、非常に納得でした。

 

相関と回帰(回帰直線)

その場合、直線はデータに最もよく当てはまるものが望ましいでしょう。そのためには、当てはまりの良さの基準をまず決める必要があります。図2をご覧ください。各測定値と直線のy座標の差e1,e2,e3が小さい直線は当てはまりが良いと言えるでしょう。したがって、これらの2乗の和である。

e1^2 + e2^2 + … + en^2

を当てはまりの良さの尺度とします。したがって、これを最小にする直線が「最も当てはまりの良い直線」となります。このようにして直線を求める方法を最小2乗法と言い、求められた直線を回帰直線と呼びます。

非常に最小二乗法についてわかりやすい説明でした。

各点に対して、直線とのそれぞれの距離が最も小さく線が最小二乗法の直線になります。

大学1年生の時に、ニュートン法でそのような直線も書いたりしたような記憶が蘇ってきました。

 

感想

色々と学びがあったのですが、初めて統計を学ぶ人は結構難しく感じました。

むしろ、統計を学んだ人が復習として、こんなのあったよねといった形で学ぶ方が良いように感じました。

 

一つのトピックについて、左に文章で1ページ、右に図で1ページで計2ページでまとめられているため、難しい内容もかなり簡潔にまとめられています。

そのため、概要は理解できるけど深く学ぶことは難しいので、統計について詳しく学ぶためには別に書籍が必要だと思います。