統計学についての基本

ビジネス分野で、統計学に対するニーズが増えています。
もともと、ビジネスと統計学との間には親和性が高かったのですが、最近のPCの性能の向上とともに、ビジネス分野で統計学が頻繁に使われるようになりました。

最近も、下記の本が25万部売れたという報道もあります。
統計学が最強の学問である
統計学が最強の学問である
統計学が最強の学問である
単行本(ソフトカバー)– 2013/1/24 西内 啓   (著)

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。

「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人が、その本当の魅力とパワフルさを知っているだろうか。

本書では最新の事例と研究結果をもとに、基礎知識を押さえたうえで統計学の主要6分野

・社会調査法
・疫学・生物統計学
・心理統計学
・データマイニング
・テキストマイニング
・計量経済学

を横断的に解説するという、今までにない切り口で統計学の世界を案内する。

統計学によって得られる最善の道を使えば、お金を儲けることも、自分の知性を磨くことも、健康になることもずいぶんと楽になるだろう。

だがそれはあくまで副産物である。統計リテラシーによって手に入る最も大きな価値は、自分の人生を自分がいつでも最善にコントロールできるという幸福な実感なのだ。 (「おわりに」より)

さて、統計学は、本当にパワフルなのでしょうか。下記は、2014年J1のデータ(1試合平均2.53点)をポアソン分布(詳細は【参考】を参照)に当てはめたものです。

「理論」は、ポアソン分布の様子数値で、「実際」は、実際のJ1の1試合当たりの得点です。両者がほとんど一致していることが分かります。

2014年J1リーグの得点分布

2014_j1graph]

過去のデータを使うと、翌年のJ1リーグの得点分布も予想できます。

2015年J1リーグの得点分布

2015_j1graph

同じように、航空機の事故確率や、不良品が混じる確率もポアソン分布で計算できます。ちなみに、最近、乗る予定の飛行機が墜落する確率を教えてくれるアプリが話題です。(http://gori.me/iphone-app/70525

appli

羽田から福岡行きの日本航空機を指定してみると、墜落する可能性は3,809,362分の1だと表示されます。確率にして0.000026251%。墜落事故を経験するためには毎日同じルートの飛行機を10,436年乗り続ける必要があるとのことです。

また、下記のようなケースは、ビジネスでよくある「課題」です。

【ケース1】

狭心症に対して有効なA薬の治療効果は65%であるとしられている。B薬の治療効果は43例中31例であった。B薬はA薬に比べて優れているといえるか。

【ケース2】

あなたは、会社の先輩から、下記の調査を依頼されました。

(1)’task A’ ・・・近域に本店所在地を置く会社の社長の平均年齢に関する調査

(2)’task B’・・・近域で営業するラーメン店のランチセットの平均価格の調査

(3)’task C’・・・「サービス認知度」に関する調査(n=300

顧客が定義するパラメータと合致した企業および団体に対し「オフィス向けに据え置き菓子を提供するサービスの業態」の存在がどの程度認知されているかを確認する。

task A は 100 社を、task B は 10 店を、両者とも無作為に抽出して自分で調べました。

先輩の話によると、両タスクとも全数調査(とみなしていいような性格)の結果がすでに存在するようです。

具体的には task A の平均が 58.2 歳, task B の平均が 750.0 円だと伝えられています。今回はこれらについて統計的に検定をおこなうよう先輩から指示を受けています。

また、先輩の話によると、OSS社はおよそ 3 年前、「サービス認知度」に関する)’task C’と同様の調査を他社でより大規模におこなっているようです。そのときの認知率は 22.0% であったとのことでした。

このような「課題」に対して、統計学は、正確な「答え」を用意しています。統計学は、100年以上も歴史のある学問です。パソコンなどなかった昔から今に至る長期間、存在したこと自体が「統計学」の有効性を示しています。

また、最近は、「ベイズ統計学」がブームになっています(詳細は【参考】を参照)。これについては、別途説明しますが、従来の統計学を根本的に変えるような考え方です。しかし、はやりの「ベイズ統計学」も、理論自体は、18世紀のものなのです。

参考【ポアソン分布】

統計学および確率論においてポアソン分布 (Poisson distribution)とは、数学者シメオン・ドニ・ポアソンが1838年に確率論とともに発表した、所与の時間間隔で発生する離散的な事象を数える特定の確率変数 X を持つ離散確率分布のこと。

或る離散的な事象に対して、ポアソン分布が単位時間当たりの生起確率を示し、指数分布は生起期間の確率を示す。定数λ>0に対し、自然数を値にとる確率変数X

shiki
を満たすとき、確率変数Xはパラメータλのポアソン分布に従うという。ここで、e はネイピア数 ( = 2.71828…)であり、k! は k の階乗を表す。

また、λ は所与の区間内で発生する事象の期待発生回数に等しい。P(X=k)は、「単位時間中に平均で λ回発生する事象がちょうど k 回(k は非負の整数、k = 0, 1, 2, …)発生する確率」に相当する。例えば、事象が平均で2分間に1回発生する場合、10分間の中で事象が発生する回数は、 λ=5のポアソン分布モデルを使って求められる。


【具体的な例】

ポアソン分布は、ポアソン過程に関連して発生します。これは、離散的な自然現象(所与の領域内や所与の時間内において、0回、1回、2回、3回… と発生する現象)に該当するものであり、現象が発生する確率は、時間ないし空間内において一定です。
また、時間または空間における発生間隔は指数分布になります。以下で、その例を示します。

・1時間に特定の交差点を通過する車両の台数。
・1ミリリットルの希釈された水試料中に含まれる特定の細菌の数(細菌数検査における最確法)。
・単位面積あたりの雨粒の数。
・1ページの文章を入力するとき、綴りを間違える回数。
・1日に受け取る電子メールの件数。
・1時間あたりの電話がかかってくる件数。
・ある一定の時間内の店への来客数。
・1分間のWebサーバへのアクセス数。
・1時間あたりのウィキペディアの最近更新したページの編集数。
・1キロメートルあたりのある通り沿いのレストランの軒数。
・1ヘクタールあたりのエゾマツの本数。
・1立方光年あたりの恒星の数。
・単位時間あたりの放射線の計数値であるカウント毎分やカウント毎秒(半減期による減衰や外部からの放射能などによる変動がないと仮定して)。

【歴史的例】

上記の例のほか、歴史的に有名な事例としては、ロシア生まれでドイツで活躍した経済学者、統計学者のボルトキーヴィッチ(Владислав Иосифович Борткевич)による「プロイセン陸軍で馬に蹴られて死亡した兵士数」の例が知られています。

ボルトキーヴィッチは著書”Das Gesetz der kleinen Zahlen “(The Law of Small Numbers)[3]において、プロイセン陸軍の14の騎兵連隊の中で、1875年から1894年にかけての20年間で馬に蹴られて死亡する兵士の数について調査しており、1年間当たりに換算した当該事案の発生件数の分布がパラメータ0.61のポアソン分布によく従うことを示している。

【事象の特徴】
上記のように、稀にしか起こらないような現象を大量に観測した結果がポアソン分布に従う例は極めて多く見られます。
このようなポアソン分布に従う事象の中で、時間の経過とともに発生する事象の特徴は次のようにまとめられます。

  1. (希少性):時間幅の間に着目している事象がちょうど1回起こる確率が、2回以上起こる確率が
  2. (定常性):事象の起きる確率は、どの時間帯で同じ
  3. (独立性):事象の起きる確率は、それ以前に起こった事象の回数や起こり方には無関係

ここで、はに対して高位の無限小を表しており、のスケールに注目したときに無視できる微小量であることを表します。

【ベイズ統計学とは】

「ベイズ統計学」は、18世紀イギリスの確率論研究家トーマス・ベイズ(1710-1761)が提案した「ベイズの定理」とよばれる逆確率計算法を基礎にした統計学の体系です。

これに対して、現在広く大学などで教えられ応用されている統計学の体系(検定、推定など)は、統計学史的にいうと「ネイマン・ピアソン理論」といわれ、20 世紀の統計的品質管理の考え方をややむりを承知で統計理論に仕立てたものとなります。

よくできた理論である一面、たとえば「有意水準5%」が天下りで不自然であるなど、初心者から見てもおかしな疑問点がいくつもあります。
もとは品質管理理論であったことの限界が見えているのであろう。初心者の疑問の方が正しかったのである。

そういう不自然な仮定を必要としないベイズ統計学が、このような中で脚光をあびてきたのは当然である。

現在、本場アメリカの統計学者の半分近くはベイズ主義統計学者(ベイジアン)であるといわれ、わが国の統計理論の研究者も、かなりの割合でベイズ統計学に一定の理解を示すか、これを信奉しないまでも少なくとも知識のレパートリーに持っていなければ研究が成り立たない時代がやってきている。(http://www.qmss.jp/appstat/contents/bayes/

いずれにしても、現在のビジネス界においては、ビジネスマンの誰もが「統計学」と無縁では生きていけない時代が到来していることは事実なのです。

お問い合わせ

さくさく勉強法へのご意見・ご感想などはこちらからお問い合わせください。

*の付いている項目は必須項目です。

お名前 (漢字)*

お名前(カナ)*

メールアドレス*

お問い合わせ内容*

さくさく勉強法をどこで知りましたか?

上の質問で「検索」と答えた方は、検索したキーワードをご記入ください。

【メッセージの確認】

お問い合わせの内容はこちらでよろしいですか?
よろしければチェックいただき送信ボタンをクリックしてください。