統計学を始めて学ぶ人は、どこから理解していくべきなのか判断に迷ってしまうでしょう。
統計学は非常に奥が深く、幅広い学問です。
したがって、まずは基本的な用語を押さえることから始めましょう。
この記事では、統計学における基本的な手法や選び方を詳しく解説していきます。統計の方法についてしっかり理解できるので、ぜひ最後まで目を通してみてください。
この記事は、次のような人にぴったりの内容です。
- 統計学を基礎から学びたい人
- 統計方法の種類を把握したい人
- 統計手法の選び方が分からない人
それではまず、統計学とはいったいどのような学問なのかから解説していきます。
統計学とは?
統計学とは、内容にバラつきがあるデータの性質を調査したり、母集団から標本を抽出して性質を推測したりする方法を体系化した学問のことです。
冒頭で触れたとおり、統計学は非常に奥が深い学問ですが、
- 推測統計:サンプルから母集団の特性を推測して整合性を検定する
- 記述統計:データを収集して傾向や平均から特徴を掴む
の2つに分けることができます。
以前は、経験や勘を頼りに意思決定をする企業が多くありましたが、統計学を使いこなしてビックデータを分析すれば効果的なマーケティング戦略の立案ができたり、新しい商品・サービスの開発に有効な情報が得られたりすることが分かってきたため、統計学が見直されています。
初めて統計学を学ぶ人にとっては難しく感じるものですが、まずは落ち着いて専門用語の意味を押さえることが始めましょう。
統計にはどんな方法がある?
統計学は医学系の研究でも利用されていますが、主な解析方法は、次の11項目です。
- 2群間の独立した連続変数の比較
- 2群間の対応した連続変数の比較
- 2群間の独立した比率の比較
- 2群間の対応した比率の比較
- 3群間以上の独立した連続変数の比較
- 3群間以上の対応した連続変数の比較
- 2つ連続変数の相関を評価
- 比率の多変量解析
- 連続変数の多変量解析
- 2群間の生存曲線の比較
- 生存極性の多変量解析
2群間・3群間での比較や比率と連続変数の比較、相関・多変量解析などで用いられています。
統計の方法はいろいろありますが、まずは以上のような組み合わせから成り立っていることを理解できれば問題ありません。
今回は、統計学の初心者が押さえておくべき統計学の手法を3つ解説していきます。
- 分散分析
- t検定
- 多重比較法
順番にチェックしていきましょう。
分散分析
分散分析とは、比較対象の群が3つ以上ある場合に使用する統計学の方法です。
分散分析は後ほど紹介する比較方法とは違って多重比較になるので、落ち着いて適切な手法を選択する必要があります。
分散分析の正しい手法を選択するのは専門的な知識を要するので、専門家にアドバイスを求めることがおすすめです。
t検定
t検定は、2つのグループを比較するときに利用される統計学の方法です。
それぞれの群で標準偏差と平均値を求めてt値を算出し、水準値を比較して結論を出す流れになります。
先に紹介した分散分析とt検定は、正規分布であることを前提に統計を出します。
また、t検定においては2群間の標準偏差が等しい状態であることを仮定した上で実施する必要があります。
いずれの方法においても前提や過程が成立していない状態でそれぞれの手法を適用すると誤用になるので注意してください。
多重比較法
多重比較法とは、3群以上の比較対象を母平均の差で検定する統計学の手法です。
多重比較法でデータを比較する方法は、次の2種類があるのでチェックしておきましょう。
- 全群比較(対比較)
- 群集合比較(線形比較)
全群比較は、考えられる組み合わせについてすべて比較する手法であり、群集合比較は群を2つに分けて2群間で比べる方法です。
多重比較法は他の方法と比べて、比較方法や有意水準の設定方法が非常に重要になります。有意水準とは、実際に観察された以上の差が見られる確率がどれくらい小さい場合に有意とするかという水準のこと。
誤った理解で手法を適用すると、統計結果に大きく影響を及ぼす可能性があるので注意してください。
統計の解析方法の選び方
統計学の解析方法を選ぶときのポイントを2つ紹介します。
いろいろな選択方法がありますが、次の2つは最低限チェックするようにしましょう。
- 2群のデータに差があるか
- 2群のデータに関連性があるか
それでは、それぞれ順番に内容を紹介していきます。
2群のデータに差があるか
2群のデータに差があるかどうかをチェックするときは、順序尺度以上なのか分割表なのかによって解析方法が変わります。
順序尺度以上である状態とは、順序尺度、比例尺度、間隔尺度のいずれかである場合であり、分割表とは、データをカテゴリー化して作成した表のことです。
順序尺度で解析方法を選択する場合は非常に複雑になりますが、分割表の場合は要因の水準が2つであるか否かや水準の内容によって解析方法を決定していきます。
2群のデータに関連性があるか
2群のデータに関連性があるかを見るときは、相関係数が必要なのかどうかで解析方法が異なります。
例えば、相関係数を知りたい場合は順位相関係数を使用することになりますし、必要でない場合はデータがカテゴリー化できるのか否かや要因の内容などによって解析方法を決定します。
まとめ
ビックデータを解析して企業におけるさまざまな意思決定に有効な情報を手に入れられる統計学は、近年特に注目を集めている学問です。
初学者は理解するのが難しく感じるかもしれませんが、まずは基本的な用語や考え方からしっかり押さえていけば問題ありません。
統計学におけるデータの比較方法は非常にたくさんありますが、群が多くなるほど適切な結果を出すのが難しくなります。
適当に統計手法を選んで分析を進めても、間違った分析結果が出てしまうので無理をせず専門家に意見を求めるようにしましょう。
統計解析の方法については
統計解析とは?統計解析の種類や知っておきたい用語について詳しく紹介しますhttps://kotodori.jp/research/statistics-analysis/
の記事で詳しく解説しています。
ぜひ参考にしてください。
無料お役立ち資料フォーム
<参考>
- 統計解析にはどんな種類があるのか(深KOKYU)
https://haru-reha.com/statistics-type/#toc2 - 01本扉[001]
http://www.chugaiigaku.jp/upfile/browse/browse1660.pdf - 統計手法の選び方(医薬学データ用統計解析プログラム)
http://www.gen-info.osaka-u.ac.jp/MEPHAS/tebiki.html#2