ちいさな森

ぶよっこりーの頭の中

統計を学ぶメリットと入門方法について。

f:id:buyoccoli:20190512173359j:plain

統計の本

統計と聞くと何を浮かべますか?
最近だと、統計不正でしょうか・・・。 
近年話に登ることが多いAI(人工知能)にも統計が大きく関係しています。 何かと注目されることが多い統計ですが、これからの時代の必須スキルになることは間違いなさそうです。

 

統計を学ぶメリット

統計を学ぶことによって得られる具体的なメリットは以下の通りです。

 

平均値などに振り回されない。

先日、「今の30代・40代の平均貯蓄額は194万円」というニュースがありました。 これを見て、多いと思いますか? 少ないと思いますか? 気になるのは”平均”という文字。 ここでちょっと知識がある人であれば、「貯蓄額が0の人と、1億の人がいるとして、2人の平均をとれば、平均貯蓄額は5000万円じゃん。平均なんて意味がないよ」という反論ができるかと思います。

 

確かにその通りで平均はただ”数字を足し合わせて、その数で割ったもの”に過ぎないので、ある団体の傾向を指し示す代表的な値としてふさわしくないことも多々あります。

 

けれど、統計にもっと詳しい人であれば、さらに「この平均値は偏っているかもしれない。でも、そんな問題のある平均値を使ったりはしないだろう。何らかの調整が入っているに違いない。」とか、「この平均の元となるデータは、どんな形だろうか。元のデータを見ないと何とも言えないぞ」と考えつくことができます。

 

そこで、元データを少し見てみましょう。 するとこのようなことが書いてあります。

”当該設問では、上位数%のデータにみられた極端な値(貯蓄額が数千万円・数億円など)の影響を除外するため、10%調整平均(上位と下位からそ れぞれ 10%のデータを除外して算出した相加平均)を利用しています。”

http://www.smbc-cf.com/news/datas/chousa_190306.pdf

要するに、極端な数字は省いて平均値は算出されているということがわかります。 また表を見てみると、二つの山が見て取れます。

 

貯蓄が少ないグループと多いグループです。 この統計値を元に、何をするかは人によって、もしくは事業者によって異なりますが、単純に平均値を見ただけで判断できることは少ないといえるでしょう。 また、そもそものこの表を作成するのに、使った母数(人数)が適正かどうかというところも考えなくてはいけないかもしれません。

 

 

フラットな目線でものを見ることができる

テレビや新聞では、目立つ大きな数字を使いがちです。 けれども、その裏では、もっと具体的で目だたない数字が隠れています。

 

例えば、予防接種はどうでしょうか。予防接種での死亡者があると聞いて、子どもの予防接種をためらった人は少なくないと思います。私自身、娘の初めての予防接種の時は眠れないほど悩みました。けれども、実際に予防接種によりなんらかの疾患が生じた件数と実際にその病気に罹患した場合における予後不良を考えると、予防接種を行うことに軍杯が上がります。それでも、「副反応、ゼロじゃないやん・・・」という気持ちは残るのですが・・・。

 

 

こちらの話に関しては、FACTFULNESS(ファクトフルネス)という本が大変オススメです。 悪いニュースしかニュースにならない。だから、人間はどうしても世界はネガティブな方向に進んでいると判断しがちだ、という話を豊富な事例を交えて展開しています。 

FACTFULNESS(ファクトフルネス) 10の思い込みを乗り越え、データを基に世界を正しく見る習慣

FACTFULNESS(ファクトフルネス) 10の思い込みを乗り越え、データを基に世界を正しく見る習慣

  • 作者: ハンス・ロスリング,オーラ・ロスリング,アンナ・ロスリング・ロンランド,上杉周作,関美和
  • 出版社/メーカー: 日経BP社
  • 発売日: 2019/01/11
  • メディア: 単行本
  • この商品を含むブログ (1件) を見る
 

 

 

目立つ数字だけにとらわられずに、何かニュースを目にした時に、「それでは、その背景、元となるデータを検証しよう」と思えるのも、統計スキルを身につけたものならではの視点です。

 

 

AIの裏にあるものへの理解が進む

AI(人工知能)のニュースを聞かない日はないと言っていいほど、日々人工知能についてのニュースを目にしますが、人工知能がそもそも何なのかを把握している人は少ないのではないでしょうか。ニュースやCMでもややミスリーディングなものが多く並んでいるように思えます。

 

人工知能は、大量のデータ処理ができるパソコンで、統計データを駆使して予測をたて、行動させる、というものです。厳密には、人工知能の裏にある技術(機械学習)は未来への推論で、統計は過去の解析だ、という風に語られることもありますが、使い方の差だけで、ほとんど違いはないように思われます。

 

 

オススメの統計の本。

まずは統計がどう役に立つのかをざっくりとでも理解できるといいと思います。 こちらのメインは育児ブログなので、この本なんかオススメです。

「学力」の経済学

「学力」の経済学

 

 

上でも挙げましたが、FACTFULNESS。 令和への改元の際に、知人に「平成はあんまりいい時代じゃなかったしねえ」と言われたので、とりあえずFACTFULNESSをお勧めしておきました。私たちはいつもデータに対して、公平ではなく、メディアが流す悪い数字への影響を受けやすいんだ、ということを一応知っておくべきでしょう。

FACTFULNESS(ファクトフルネス) 10の思い込みを乗り越え、データを基に世界を正しく見る習慣

FACTFULNESS(ファクトフルネス) 10の思い込みを乗り越え、データを基に世界を正しく見る習慣

  • 作者: ハンス・ロスリング,オーラ・ロスリング,アンナ・ロスリング・ロンランド,上杉周作,関美和
  • 出版社/メーカー: 日経BP社
  • 発売日: 2019/01/11
  • メディア: 単行本
  • この商品を含むブログ (1件) を見る
 

 

もっと、ズバリ統計の本でお勧めは、こちらです。 文系の人、しばらく数式(数字)を扱っていない人でも読むことができます。

 

統計のはなし―基礎・応用・娯楽 (Best selected business books)

統計のはなし―基礎・応用・娯楽 (Best selected business books)

 

 

こちらの統計の本は読み物としても秀逸です。 何回も読みました。 ここまでくれば、ニュースなどを読み解く際の統計基本スキルはバッチリです。 さらに、たくさんの要素がある場合の統計処理であったり、さらに実際手を動かしてみたい! という人には以下をお勧めしておきます。

多変量解析のはなし―複雑さから本質を探る (Best selected Business Books)

多変量解析のはなし―複雑さから本質を探る (Best selected Business Books)

 

 

Rによるやさしい統計学

Rによるやさしい統計学