ビッグデータの時代に必須!「統計学」ってどういう学問?
- 2015/6/16
注目の高まる統計学
これからの時代は「ビッグデータの時代」だと言われています。社会の情報化は進み、膨大な量の情報が蓄積されるようになりました。その情報を活用すれば、ビジネスや気象、災害、経済、科学技術などあらゆる面で大きな変化を起こすことができると期待されています。そのビッグデータを駆使するために分析する方法が、「統計学」です。ここ最近では、書店に行くと多くの統計学関連の書籍が並べられ、ビジネスパーソンの間でひそかに注目が集まっています。統計学とはどのような学問なのでしょうか。
膨大なデータから規則性を見出す
私たちの周りには、様々なデータが存在します。例えば、学生時代に受けたテストの点数、高校の偏差値、会社の株価や収益状況、気温や湿度、降水確率などなど、数え始めたらきりがありません。しかしそのデータをそのまま眺めても、それを理解することも利用することもできません。それらのデータを規則正しく集めて、分析することではじめてデータを私たちが役立てることができるのです。
そしてデータはもちろん全て同じ値ではなく、ものによってわずかに、もしくは大きくばらつきがでることがあります。このようにばらつきのあるデータから、その性質を調べるための手法が統計学なのです。
どのように分析するのか?
統計学には「記述統計」と「推測統計」があります。特定のデータを集めてそれをグラフにし、データの性質を明らかにするのが記述統計で、母集団からデータの一部をサンプル(標本)として取り出し、そのサンプルの傾向を調べることで母集団全体の性質を明らかにするのが推測統計です。実際に統計を分析するときに使われるのは、多くが推測統計です。
例えば学校のテストの点数からそのクラスのレベルを知ろうとすると、クラス全員のテストの点数から平均点を調べることになります。複数のクラスで同じように調べることで、そのクラスがどの程度のレベルなのか明らかにすることができます。さらに細かくどの生徒がどのような問題につまずくのか、どのような問題が苦手なのか、と割り出すためにはさらなる調査が必要になりますが、このように調べたいデータの全てを対象として分析する(全数調査)のが記述統計の特徴です。
しかし、その調査対象が全国の小学生などと膨大な数になっていくと、すべてのデータを分析するのはほぼ不可能になっていきます。そこから生まれたのが推測統計です。推測統計では、母集団から標本を抽出し、その標本から代表的なデータを集めて分析することで全体の特徴も明らかにします。例えば全国の小学生という母集団からランダムに1000人選び出し(標本抽出)、その1000人にアンケート調査して、その結果を小学生の特徴として明らかにすることなどです。みなさんは選挙速報のニュースを見たときに、開票率が数%のうちから「当選確定」と報道されることを疑問に思ったことがあるのではないでしょうか。これも、出口調査などで一部の人からデータを集めることで標本調査しているのです。
活用の場が広がる統計学
標本調査するときに重要なのが、その標本調査の結果が本当に母集団の性質を表しているのか、ということです。調査によってどの程度の標本調査をすべきかはちがってきます。調査のやりかたを知らないと、大きく誤差が出て標本調査した意味がなくなってしまうため、推測統計は統計学をしっかりと学んでからでないと危険なところがあります。
これからの時代は、ビッグデータとその活用方法の広がりによって、大きく変化していくでしょう。例えばマーケティング、製品開発、天気の予測、WEB広告の表示、株式市場や為替市場などです。これから勉強してみようという人には統計検定や統計調査士という試験もありますので、挑戦してみてはいかがでしょうか。