統計学を使った適切なサンプル数の求め方とは?

この記事を読むのに必要な時間は約 7 分です。

統計学を学んだことがあれば、サンプル数とサンプルサイズという言葉を知っているでしょう。

しかし、サンプル数とサンプルサイズの違いを明確に指摘できる人はそれほど多くありません。

そこで今回は、統計学におけるサンプル数とサンプルサイズの相違点を分かりやすく解説していきます。

また、サンプルサイズの求め方も合わせて紹介するので、サンプル数やサンプルサイズについての知識がまったくない人でもしっかり理解できる内容になっています。

この記事を読めば、統計学の基本であるサンプル数とサンプルサイズのポイントをしっかり抑えられます。

この記事は、

  • 統計学の基礎を押さえたい人
  • サンプル数とサンプルサイズの違いが分からない人
  • サンプル数とサンプルサイズの求め方が知りたい人

におすすめです。

それではまず、サンプル数とサンプルサイズの違いから解説してきます。

サンプル数とサンプルサイズとは?

サンプル数とサンプルサイズの違いを簡単にいえば、次の通りになります。

  • サンプル数:標本の抽出回数
  • サンプルサイズ:個体数

サンプル数は、標本数や群数のことであり、標本抽出をした回数のことを指します。一方、サンプルサイズは、各群の個体数やサイズ、各標本のことで1度の抽出で調べた個体数です。

したがって、サンプル数は群数のことでサンプルサイズは各群の大きさや個体数といえるでしょう。

サンプルサイズの求め方とは?

この章では、サンプルサイズの求め方について分かりやすく解説していきますが、まずは、サンプルサイズを求める前に押さえておくべきポイントを先に紹介します。

サンプルサイズを求める上で非常に大切なので、この機会にきちんと押さえておきましょう。

サンプルサイズを求める前に必要なこと

サンプルサイズを求める前には、あらかじめ次の2点を決定しておく必要があります。

  • どの程度の誤差を許容するか
  • 信頼係数はどのくらいにするか

それぞれのポイントについてもう少し詳しく解説していきます。

【どの程度の誤差を許容するか】

サンプルサイズを計算するためには、どの程度の誤差であれば許容するのか事前に決めておく必要があります。

なぜなら、標準調査で統計を取る場合は必ず標準誤差が発生するからです。

標本調査とは、母集団の中からいくつかの標本を抽出して統計を出す方法であり、正確な統計を出すためには、調査対象になる母集団全員に対してアンケート調査などを実施して情報を集める必要があります。

しかし、母集団全体に調査を実施するのは、時間的・費用的に難しいため、統計を取りたい場合には標本調査を実施するのが一般的になっています。

標本調査では、標準誤差が少ないほどより現実に近い正確な統計が取れているといえます。

しかし、あくまでも母集団の中からいくつかの標本を抽出して統計を取るため、現実的には標準誤差をゼロに抑えるのは難しく、調査を実施する前に調査に対してどれくらいの正確性を求めるかを決めておく必要があります。

どこまでの誤差を許容範囲とするかによって調査の精度が変わるので、どの程度の誤差を許容するか、事前に決定しておくことが非常に大切です。

【信頼係数はどのくらいにするか】

信頼係数をどのくらいの値にするかを決めることも、とても重要です。

信頼係数は信頼度とも呼ばれますが、母数を推定するときに用いられます。

信頼区間と呼ばれる区間の中に、母数が入っている確率が1に近い数値1-α (0<α<1)にしたときの1-α を信頼係数と呼びます。一般的には、信頼係数を90%~95%に設定して統計を取ることが多くあります。

ちなみに、信頼区間とは真の値が母集団の平均でどれくらいあるか推定する区間のことです。例えば、標準誤差を用いた場合の信頼区間は次の通りになります。

統計 サンプル

サンプルサイズの求め方

ここからは、信頼係数を95%とした場合のサンプルサイズを求めていきましょう。

前述したとおり、信頼区間を95%すると許容できる誤差は1.96×標準誤差(σ ÷√n)で求められます。

式を逆算すればサンプルサイズ(n)を計算することができるので、信頼係数とσが分かればサンプルサイズが求められることが分かります。

σが分かっていない場合は、標本データから数値を用いて計算する必要があります。許容誤差は正負同様の範囲で計算するのが一般的です。

サンプルサイズの求め方は以上の通りですが、複雑な計算をする必要があることから計算フォームを使うケースが増えています。

計算フォームを使えば、信頼度や母比率などを入力するだけで必要なサンプルサイズが算出されるので、時間や手間を省きたい場合は利用するといいでしょう。

まとめ

統計学では、サンプル数とサンプルサイズについての理解が前提になります。

今回説明した通り、サンプル数は標本の抽出回数であり、サンプルサイズは個体数のことです。

統計学の基本的な用語である2つを混同して理解する人がいますが、まったく意味が異なる用語なので間違えないようにしましょう。

 


<参考>

  1. サンプル数とサンプルサイズの違いをわかりやすく解説(全人類がわかる統計学)
    https://to-kei.net/basic/glossary/samplesize/
  2. 信頼係数(しんらいけいすう)とは(コトバンク)
    https://kotobank.jp/word/%E4%BF%A1%E9%A0%BC%E4%BF%82%E6%95%B0-82698
  3. 1-4. 必要なサンプルサイズ1(統計WEB)
    https://bellcurve.jp/statistics/course/9129.html