統計は非常に面白く、役に立つ分野である。ただし、統計には不可解な専門用語が多く、初学者がいきなり専門書を買って読むと、最初の10ページで力尽きることうけ合いである。
したがって、初学者にとって「入り口としてわかりやすい本」を探せるかどうかは、結構重要な問題である。
さて、そのような方におすすめの本が、「マンガで分かる統計学」である。おすすめの理由は大きく2つ。
1.厳密さを追求せず、実用性に特化している。
2.初学者がつまりやすそうなところにきちんとわかりやすい解説がついている
実際、マンガであるかどうかはあまり重要ではなく、筆者の「これおかしいと思いませんか?」であったり、「ここは知らなくてもOK!」であったりと、コメントが非常に役立つ。
構成はオーソドックスで
1.ヒストグラム
2.平均・分散
3.標準偏差
4.正規分布
5.二項分布
6.推測統計(t分布、カイ二乗分布)
7.仮説検定
と、実務上必要な大体の範囲を押さえている。
たとえば、2項分布の例題として出題されている問題が下の問題だ。
720個のサイコロを振って、150個以上、1が出る確率は?
組み合わせの数を確率計算するのは計算がややこしすぎる。したがって、統計を用いて「確率は大体◯%」として答えを出してしまおう、というのが統計の使い方だ。
上の例題では「2項分布」の説明がなされている。
”この世の中に、Aか、A以外しかない、ってモノなら、2項分布が使える。”
すなわち、サイコロの目は1が出る、か、1が出ない、に分けられるので、上の問題は2項分布を用いて答えが出せるということだ。
ここから下の引用は本を読んでいただいたほうが良いと思うので、数学に興味のない方は飛ばしていただければと思う。
2項分布 B(n,p) n=720 p=1/6は、
平均:np 分散:np(1-p) の正規分布に近似できるので、出るサイコロの目は、平均120(=720×1/6)、分散100(=720×1/6×5/6)と計算できる。
したがって、標準偏差は10(=√100)
150この1の目が出るということは、平均の120個から30個、すなわち標準偏差3つ分外れているので、+3σから上に外れる確率は約0.13%である。
要は、殆どありえない、というイメージである。
120個と150個では、大して違わないように見えるが、直感とは異なり、まず偶然では出ない、という結果は統計を知っていなければあまりピンとこないだろう。
確率・統計とは、誠に不思議で面白いものである。