2016.12.19

統計入門

しおん

こんにちは。りけぷらのしおんです。

サイエンス超入門ということで今回は簡単に統計のことを書こうと思います。

 

もうすごい基本的なことしか書くつもりないので「統計って何!?美味しいの?」って感じの人向けです。

 

そもそも統計は何の役に立つのか

 

中学生くらいでやる統計は分散や期待値の定義、中央値や四分位点などの代表値くらい。

例題もクラスのテストの平均点など、そんなもの求めて何がしたいの?

と意味の分からないまま過ぎ去ってしまうような人も多いと思います。

実際、どうして統計を行うのでしょうか。

 

有用性がはっきりと分かりそうなのが、薬の例です。

薬学の分野では、プラシーボ効果を常に考慮しなければなりません。

プラシーボ効果とは「病は気から」そのもので、「薬」ではなく「お医者さんにもらった薬を飲んだ」ことで気持ちが楽になり、思い込みにより実際に薬効が現れてしまう効果です。

 

新しい新薬を開発したときに仮に効果があったとしても、それがプラシーボによるものなのか、薬の効き目によるものなのか、はっきりさせなくてはなりません。

 

そうゆうときは被験者をプラシーボの薬を投与されるグループと、新薬の薬を投与されるグループに分けて、t検定というものを行います。

ここでt検定の話をしてしまってもよいのですが、この連載は入門向けということなので、また今度この話の続きをしようと思います(`・ω・´)

 

これ以外にも統計の目的は色々あって、

・都道府県ごとの犯罪率の違いや出生率の違いなどデータを要約したい

・サイコロの結果から、手持ちのサイコロがイカサマか判定したい

・一部の家庭のテレビの視聴率から、全国のテレビの視聴率を推定したい

など、要約、検定、推定などにおおまかに分かれます。

 

 

 

今回は疲れたのでこのへんにして、最後に平均と分散の定義の確認をしようと思います。

入門コラムなので分かりやすさを先行させて日本語で書こうと思います。覚えている人は読み飛ばしていただいて全く構いません。

 

平均=(観測データの値の和)/(観測データの数)

 

ここでいう平均とは狭義には相加平均のことです。たとえばABC という3人の体重がそれぞれ 55 kg60 kg80 kg であったとすると、3人の体重の平均値は (55 kg + 60 kg + 80 kg)/3 = 65 kg
ですね。

ここまでは余裕でしょう

 

次は分散です。

分散=Σ(観測データの値 - 観測データの平均)^2 /(観測データの数)

 

ここで(観測データの値 - 観測データの平均)^2をすべての観測データについて足し合わせているということを、Σという記号で表現しています。

 

先の例では65kgが平均なので、

(65-55)^2+(65-60)^2+(80-65)^2の総和は350、これを3で割るので350/3が分散ですね。

 

 

終わりです。読んでくれてありがとうございました\( ‘ω’)

しおん

理系を身近に感じられるような記事をめざしてます!よろしくお願いします。(`・ω・´)

この連載の記事

連載コラム一覧へ

おすすめ記事

記事一覧へ

Follow us

理系+では、理系分野に興味がある人に向けて様々な情報を日々発信しています。

最新情報はSNSアカウント又はメルマガにて受け取ることが出来ます。