2020年5月26日 更新

アンケート初心者必見 基礎的な統計学の考え方③ 分散と標準偏差とは?

はじめてアンケート調査を行いたい、またはアンケート調査についてもっと詳しく知りたい、という方を対象として基礎的な統計学の知識を解説していきます。

gettyimages (128)

1、 データの散らばりを知りたい時

例えば5人のクラスにおいて算数のテストの点数を比べてみたとしましょう。A組、B組の2クラスにおいて5人の点数は以下のようになりました。
 (125)

これらの2クラスにおいて平均点はいずれも78点です。ただ、平均点が同じでもデータの特徴は大きく違いますよね。A組においてはデータの散らばりが少なく、一番高い得点の人と一番低い得点の人でも10点しか差がありません。しかし、B組においては53点もの開きがあります。

このように平均値や中央値だけを見て全体を判断するということは非常に危険なのです。そこで登場するのがデータの散らばり具合を表した分散、標準偏差といった指標です。

2、 分散、標準偏差とは

分散や標準偏差はデータの散らばり具合を表す指標です。
分散はある一つのデータセットにおいて、それぞれのデータと平均値の差を二乗して合計し、データの個数で割ることによって得られます。
そして分散の平方根が標準偏差となります。
例を用いて紹介する前に、式を見てみましょう。
分散はSの二乗、標準偏差はSを使って表します。
 (233)

 (234)

一見、とても難しそうに見えますね・・・
しかし、見た目ほどの難しさはないのでご安心ください。
これを見てまずわかることとして、分散に√をつけたもの、つまり分散の平方根が標準偏差になっています。
なので、分散を求めてしまえば標準偏差は分かったも同然です。
分散は、データセットにおいて各々のデータと平均値の差の2乗を足し上げ、データの個数で割ったものです。
そして、分散の平方根が標準偏差Sとなります。
先ほどのA組の例で見てみますね。
まず、A組の平均点は78点なので、クラスのメンバーの点数と平均点の差を求めます。
 (121)

このようになりますね。
この差分を二乗すると以下のようになります。
 (119)

そして得られた各数値を合計し、データの個数で割ります。
計算式は
(36+4+1+9+16)÷5=13.2となりますね。
これが分散です。差分の二乗を平均した値です。

ここでもし2乗をせずに足し上げるとどうなるでしょう。(-6)+(-2)+1+3+4=0となりますね。
これは、平均値からの差を足し上げると、プラスの差とマイナスの差が相殺されてしまうためです。これでは、散らばり具合が分からないので、2乗をすることによりプラスの差とマイナスの差の影響が出ないようにしているのです。

さて、分散が求められたので続いて標準偏差を求めましょう。
標準偏差は分散の平方根でしたね!
√13.2=約3.6となります。
こうして得られた数値が標準偏差です。

なぜ分散からわざわざ二乗を外して標準偏差を求めるのか、それについて現段階では、分散は大きすぎるため扱いが難しいから、という風に理解して頂ければ大丈夫です。分散は求める過程において二乗をしているので、時として大きくなりすぎることがあり、扱いにくいのです。    
そうなると分散は重要じゃないのではないか、という意見も聞こえてきそうですね。ただ、分散は後々応用がききやすいというメリットがあります。そのため、ここでは分散と標準偏差、どちらもその求め方を覚えておいてください!

さて、この計算式でB組においても分散、標準偏差を求めてみましょう。
20 件

関連する記事 こんな記事も人気です♪

アンケート初心者必見 基礎的な統計学の考え方② 平均値と中央値の違いって?

アンケート初心者必見 基礎的な統計学の考え方② 平均値と中央値の違いって?

はじめてアンケート調査を行いたい、またはアンケート調査についてもっと詳しく知りたい、という方を対象として基礎的な統計学の知識を解説していきます。
アンケート初心者必見 基礎的な統計学の考え方➀ 度数分布表とヒストグラムって?

アンケート初心者必見 基礎的な統計学の考え方➀ 度数分布表とヒストグラムって?

はじめてアンケート調査を行いたい、またはアンケート調査についてもっと詳しく知りたい、という方を対象として基礎的な統計学の知識を解説していきます。
【徹底解説】卒論におけるアンケートのやり方 その1

【徹底解説】卒論におけるアンケートのやり方 その1

大学での卒論、論文において行うアンケート調査を検討している方向け。実施方法の紹介から各手順において気をつけるべきことまで徹底解説いたします。
WEBリサーチを行うときの適切な設問数ってどのくらい?

WEBリサーチを行うときの適切な設問数ってどのくらい?

WEBリサーチを行うとき、ついついアレもコレもと聞きたくなってしまうことってありますよね。 一体設問数ってどのくらいが良いのか、迷ったときに参考にしてほしいです。
D.I.Y.リサーチ入門(7)

D.I.Y.リサーチ入門(7)

DIYリサーチのツール・サービス、アンケートの設計から分析までのかんたんな入門コラム
KOJI.A | 36 view

この記事のキーワード

この記事のキュレーター

MRJ編集長(Yuta.T) MRJ編集長(Yuta.T)