医療に携わる職種として、論文とかメーカーの出すデータを読むために、統計とか疫学の知識は必要だと思います。
論文にも信頼性のランクがありますし、メーカーの持ってくる資料はいいことばっかり書いてあるフシがあるので、そのあたりをどう解釈するのか?っていうところは結構重要だと思うんです。
調査分析手法は全く見ないで、「P値が有意だから・・・」みたいなことを考えても無駄ですよね?
で、そうなってくると、基本的な統計の考え方みたいなものが必要になるので、やっぱり統計の勉強は必要だなと思うわけです。
幸いなことに、自分の場合は、薬学部時代に「数学」のゼミに配属していて、統計ソフトと統計学についての研究をしていたので、他の人が臨床研究とかしている間に、統計をしっかり学ばせていただいたという経緯があります。
そのときの経験を元に、ここではゼロから統計を勉強したい人は何をすればいいのか?みたいなことを書いていこうと思います。
統計の計算を完璧にできる必要はない
自分が初めて統計に出会ったのは、大学の基礎科目の「統計学」でした。
初めは結構嫌でしたね。
数学系の科目って、基本的に公式を覚えて計算するっていうことの繰り返しなので、どうしたって数式を覚える必要が出てくるんです。
自分の場合は数式アレルギーってわけではないですけど、意味もわからず覚えるっていうのが嫌いでした。
そのときは嫌々覚えて、なんとか試験を通りました。
そのあとに数学のゼミに配属になったんですが、そこで統計ソフトの「R」というものに出会いました。
ここで統計学に対する考え方が変わりました。
統計を利用するときに使用されるのは「R」のような解析ソフトであって、手計算の能力は必要ないのです。
もちろん数式を覚える必要がないというわけではなく、数式の意味を理解できる程度には覚えることも必要です。
でも、計算をすることが目的ではないんです。
まず、このことだけは頭に入れておくと勉強するというハードルは一気に下がるのかな?という気がします。
手を動かすことからはじめる
はじめから「基礎統計」みたいなタイトルの教科書を開くとやっぱり挫折します。
理論先行で、実際にどう使うのか?どう使えるのか?みたいな部分がわからないので、興味が持てなくなります。
そこで、実際の統計ソフトの使い方とか解析結果の読み方とか、方法論を学ぶところから始めてしまうという暴挙に出てみましょう。
モチベーション維持的な意味でかなり有効です。
統計ソフトはトレンド的に「R」がいいと思います。
統計分野はもちろんですが、経済学・心理学・生物学・化学・物理学などかなり幅広い分野でスタンダートになりつつあるので、「R」を勉強しておけば間違いないと思います。
実際、世界的に開発が進んでいて、利用者も多いのでヘルプになるブログとかサイトが多いことも手助けになります。
たまに「Excel」で統計の勉強をする本とかを見かけるのですが、「Excel」で勉強するのはやめておきましょう。
単に表計算するためのソフトなので、統計の専用ソフトに比べるとかなり見劣りしますし、機能的に勉強には不向きです。
あと、これ↓が重要です。
普通の統計ソフトは10万円くらいの金額で販売されているのですが、「R」はGNUライセンスで完全フリーで使えます。
無料でほぼすべての統計解析ができるソフトを利用できるので、学習環境としても最適なのです。
ちなみに、「R」を使ってゼロから統計を勉強するならこの本は評判が良いです。
初版の当時は「R」のバージョンが2.6なのですが、現在は3.3ですので、そろそろ改定が必要かと思いますが、学習を進めていくこと自体にはまったく支障はありません。
というのも「R」の基本操作は当時からまったく変わっていないので、この本の内容が古すぎるということがないからです。
統計の基礎と「R」をまんべんなく学習できるので、この1冊だけでも初心者からは抜け出せるはずです。
理論はその都度勉強する
ソフトを使いながらある程度の統計の基礎を身につけて行くと、途中で疑問が浮かぶようになってきます。
「この統計手法は何を根拠に、どこまでのことを証明できるのか?」みたいなことを考えなければならないこともあります。
そうなってくると理論を理解するための本が必要になってきます。
私は薬学出身なので、この本がおすすめです。
完全に統計の基礎部分の内容なので、定理や公式の解説などが網羅されています。
途中途中に薬学部での研究内容に結びつきやすいように、医療系のデータを使った例題が豊富にあるのも良いところです。
また最後の7章には、発展的な内容として、回帰分析・分散分析・多重比較の項があります。
薬学系とか医療系の統計に限らず、統計を使うための理論が書かれています。
この辺りまでくれば、あとは専門分野の学習に入っていけると思います。
統計の専門書は結構たくさんありますし、最近では「R」を使った専門書も豊富になっています。
心理統計・社会統計・医療統計などAmazonで検索すれば沢山出てきます。
専門分野のひとに聞いてみるというのも有りです。
近くに聞ける人がいないときはブログなどを参考にしてみましょう。
たくさんの情報が眠っています。
ちなみに絶版になってしまったようですが、「R」の医療統計の参考書として私はこれを使っていました。
第2版が出るようなので、こちらが新しいものですね。
現在は中古のみの取扱で、価格が高騰していますが良書です。
もともと英語圏で「R」で統計を学ぶときに一番に上がるほど本で、「Introductory Statistics with R」の日本語版です。
医療・生物分野のサンプルデータを使いながらRの基本的な使い方を学習できるので、なぜ絶版になってしまったのかが不思議なくらいです。
一段階理論のレベルを上げる
更に詳しい統計の教科書となると、これは定評があります。
一通り基礎がわかるようになったら、次に勉強するのが多変量解析の基本理論になってきます。
構成がとても良くて、統計の基本を3章辺りまでで網羅してから、それぞれの理論について「基本→パラメトリック→ノンパラメトリック」という感じに解説しています。
ざっくり言うと、パラメトリックは身長・体重のような数値を扱う方法で、ノンパラメトリックはアンケートなどの定性データを扱う方法です。
この辺りを完璧に理解する必要はあまり無いような気もしますが、一度触れておくと、専門分野の理解に繋がることは間違いないです。
あとがき
なんとなく道筋は見えましたか?
まとめると、こうなります。
- 「R」の操作について学ぶ
- 平行して統計の基本を学ぶ
- 「R」で専門分野の統計手法を学ぶ
- 平行して理論を詳しく学ぶ
この流れでやっていけば必要なことはだいたい学んでいけるのではないかと思います。
現に私はこの方法でいろんな統計手法を理解できるようになりましたので。
初学者の方に参考になれば幸いです。