Digital_Neko

フリーランスプログラマー

統計学  確率と確率分布 -分布について-

こんにちは、Onoです。

最近はニュースで、様々なデータを見る機会が増えています。私たちはそのデータが正しく導き出されたものか、見極める能力が必要とされ始めています。その為、統計学の初歩を学んでおくことは間違ったデータに振り回されない為にも必要なことだと思います。

そこで、今回は確率と分布に関して説明して行きます。

「分布」、確率」という言葉をまず理解すれば、「すべての統計的現象は、確率分布をする」という考えを理解する事の入り口に入れます。

分布をするとは、現象(観察されうるあらゆる事実)が大小さまざまの大きさで起こることです。

具体的な例を出してみると、わかりやすくなります。

(1)人の靴のサイズは大きさが様々である、つまり人の靴のサイズは分布すると言います。

人の靴のサイズの分布をグラフにしてみるとさらに、理解が深まります。


靴のサイズごとのカウント数を、表にまとめたものを度数分布表、これをグラフにしたものをヒストグラムと呼びます(それぞれの観測値(靴のサイズ)が何回カウントされたかを「度数」(頻度)と言います。)。

例として、137人の靴のサイズをカウントした、度数分布表は下記になります。

度数分布表

これを、グラフにすると下記のようなヒストグラムになります。

ヒストグラム

ヒストグラムの横軸は、観測値(靴のサイズ)を表し、Xという記号を使用します。

縦軸は、靴のサイズが何回観測されたかを表し(度数)、fという記号を使用します。

そして、ヒストグラムの柱の頂点を結んだグラフを確率分布図(度数分布図)と呼びます。度数分布図は下記のようになります。

度数分布図

そして、作成したヒストグラムと、確率分布図を見ながら靴のサイズの分布について分析して行きます。分析については次回!!