統計調査における誤差とは?【誤差の意味と見方について徹底解説!】

この記事を読むのに必要な時間は約 8 分です。

統計調査はさまざまな目的で実施されますが、調査結果では少なからず誤差が発生します。

統計調査の誤差にはどのようなものがあるのか、詳しく解説していきます。

この記事は

  • できるだけ正確な統計調査をしたい人
  • 統計調査の誤差について知りたい人
  • 統計調査の基礎を押さえたい人

におすすめです。

それではまず、統計調査の基本的な内容と誤差の種類について解説していきます。

統計調査に見られる誤差とは?

統計調査の誤差について説明する前に、統計調査の基礎的なポイントを押さえておきましょう。

統計調査には、標本調査と全数調査の2種類の調査があります。

標本調査とは、調査対象者の母集団から一部を標本として抽出して統計を取る方法です。

正確なデータを取るためには、調査対象者全員に調査を実施する必要がありますが、調査にかかる費用や時間を考えると現実的とはいえません。

そこで、母集団の中から一定数の標本を抽出する標本調査が実施されるのです。

標本調査は、一般的に調査対象者が多い場合に実施されます。

標本調査の標本の抽出方法は

  • 有意抽出
  • 無作為抽出

の2通りです。

有意抽出は、担当者が母集団の中から意図的に標本を抽出する方法です。

できるだけ正確な統計結果になるように努力して標本を抽出するのですが、有意抽出ではどうしても主観的な標本の抽出になるため統計の精度で考えると評価できない抽出方法といえます。

一方、無作為抽出はランダムで標本を抽出する方法です。

推計値における精度の評価ができ、確率論のなどの理論を当てはめて推計結果を安定させることができるので、有意抽出と比較すると高精度な推計結果が出るのが特徴です。

全数調査は、すべての調査対象者に調査を実施する方法であり、標本調査の基礎であるといわれます。

なぜなら、標本調査で大切になる母集団を選定するためには、全数調査がなければ正確な設定ができないからです。

統計における正確性を重視するのであれば全数調査が必須です。

ちなみに、日本で一番大規模な全数調査が国勢調査です。

全数調査は標本誤差が生じない調査方法ですが、デメリットとして標本調査と比べて手間やコストがかかるということが挙げられます。

続いては、統計調査で発生する誤差について説明していきます。

統計調査には標本調査と全数調査がありますが、

  • 標本誤差
  • 非標本誤差

という2つの誤差が生じます。

それぞれの誤差について次の章から詳しく解説していきます。

標本誤差は、調査対象者全員から回答を得る全数調査だと発生しませんが、非標本誤差については全数調査でも発生する可能性があることを先に押さえておきましょう。

標本誤差 非標本誤差
標本調査
全数調査

標本誤差とは?

標本誤差とは、標本調査を実施した場合に発生する誤差のことです。

統計において評価される無作為抽出で標本を抽出したとしても、母集団との間には差が生じます。

これが標本誤差です。

一般的に、母集団と標本の抽出数が多くなるほど、または、母集団における個別データに大きなばらつきがないほど、標本誤差が小さくなります。

標本誤差を求めるときの定義は次の通りです。

標本誤差=標本値―母集団値

標本誤差の定義はあるものの母集団値を把握するのが難しいため、実際は次の計算式を使って標本誤差を把握します。

統計 誤差

非標本誤差とは?

非標本誤差とは、調査対象者の未解答や誤回答などによって発生する誤差のことです。

集計時のミスや母集団の縮図が正しくなかった場合などにも生まれるものであり、人為的なミスで発生する誤差であるといえます。

調査実施者側のミスであれば修正することができますが、回答者側のミスは把握しきれません。

したがって、どれくらい非標本誤差が発生しているかを調査実施者は把握できないのです。

非標本誤差をできるだけ発生させるためには、次のようなことを意識する必要があります。

  • 調査回答者が回答ミスをしづらい工夫をする
  • データ集計を正確にする

以上のポイントについてもう少し詳しく解説していきます。

【調査回答者が回答ミスをしづらい工夫をする】

調査をする際は、回答者に質問の意図や内容が正確に伝わるように、分かりやすい言葉を選ぶことが大切です。

調査の内容にもよりますが、できるだけ専門用語の使用は避けて誰にでも伝わる文章の質問を作成しましょう。

また、調査設計を時系列にするなどの工夫も大切です。

回答者の誤回答を防ぐためには、だんだんとドリルダウンしていく質問設定も効果的です。

質問を作る際には、統計を取るために必要な質問を作ろうと意識してしまいがちですが、回答者が質問を誤解しないように細心の注意を払うことが非標本誤差を少なくするポイントです。

【データ集計を正確にする】

回答者の回答ミスがなくても、データの集計者が人為的なミスをすると統計の正確性が落ちてしまうため、データ集計は正確にしましょう。

データ集計をシステムやソフトでする会社が増えていますが、最終的には複数人の目でチェックすることが大切です。

時間や人件費がかかるのでケースバイケースではありますが、どこまで統計に正確性を求めるかを調査実施前に考えておくといいでしょう。

まとめ

統計調査には標本調査と全数調査がありますが、どちらの調査でも誤差は発生します。

統計調査の誤差である非標本誤差と標本誤差を完全に無くすことはなかなか難しいですが、調査の実施者は2つの誤差が発生しないように最善を尽くしましょう。

誤差が少なく正確な統計を取るための調査を実施するために、今回紹介した内容を活かしてみてください。


<参考>

  1. 標本誤差(日経リサーチ)
    https://www.nikkei-r.co.jp/glossary/id=1655
  2. 標本誤差とは(市場調査ならインテージ)
    https://www.intage.co.jp/glossary/041/
  3. 標本調査の誤差と誤差情報の見方(一般財団法人厚生労働統計協会)
    https://www.hws-kyokai.or.jp/information/perspective.html
  4. 標本調査とは?~調査のしくみと設計~(統計学習の指導のために(先生向け))
    https://www.stat.go.jp/teacher/c2hyohon.html