アンケート ノンパラメトリック検定

アンケート結果はノンパラメトリックで分析を【隠れた情報を引き出せ】

統計学における「検定」とは、確率によって結論を導く作業のこと。正式名称は、統計的仮説検定といいます。

マーケターがアンケートを行う目的は、アンケート結果を集計して分析し、マーケティングの資料にすること。

そして、アンケート結果の表面上の数字に表れない隠れた情報を引き出すには、検定が必要になります。

検定にはいくつか方法がありますが、本記事では、その中からノンパラメトリック検定でアンケート分析を行う意義を解説します。

検定とは

ノンパラメトリック検定を確認する前に、アンケート業務における検定作業の意味を考えてみます。

母集団の正体を探る

アンケートを行うのは、母集団のことを知りたいからです。母集団とは、消費者アンケートであれば、消費者が、ユーザーアンケートなら顧客のこと。

マーケターが母集団の正体を正確に把握できれば、確度が高い、つまり「刺さる」マーケティング・キャンペーンを企画できます。

しかし、アンケート結果だけでは、母集団をとらえることはできません。なぜなら、アンケートの回答の1つひとつは個人の主観だからです。

そこでアンケート結果を統計的手法で分析することが必要になります。

つまり、検定が重要となるのです。

検定は3ステップで進む

検定は次の3ステップで実施します。

ステップ1:仮説を立てる

ステップ2:結果を確率的に検証する

ステップ3:結論を導く

アンケートにおける検定も同じ要領で進めます。

ステップ1:仮説を立ててアンケートを実施する

ステップ2:アンケート結果を確率的に検証する

ステップ3:結論を導く

結論は大抵「仮説は正しかった」または「仮説は間違っていた」または「仮説の正誤はわからない」のいずれかになります。

アンケートのなかの検定

実際のアンケートの検定は、次のように進みます。

ステップ1:「新製品がヒットしたのは会社のブランド力が高まったからではないか」という仮説を立ててアンケートを実施した

ステップ2:アンケート結果を確率的に検証する

ステップ3:「新製品がヒットしたのは、会社のブランド力が高まったからではなく、高い機能の割に安価だったから」という結論を導いた

この記事のメーンテーマであるノンパラメトリック検定は、確率的な検証方法の1つになります。

「ノン」を知るにはパラメトリックを理解する必要がある

ノンパラメトリック検定は、パラメトリック検定ではない検定です。そのため、ノンパラメトリック検定を理解するには、まずはパラメトリック検定を知っておいたほうがよいでしょう。

正規分布が存在するときに使える

パラメトリック検定は、母集団が正規分布のときに使うことができ、精度が高いのが特徴です。そのため、正規分布が存在するときは、より精度が高いパラメトリック検定を優先的に行い、正規分布が存在しないときにはノンパラメトリック検定を実施するといいでしょう。

正規分布とは、平均値と最頻値と中央値が一致する母集団のこと。特殊な数値を持つ要素がない母集団、ということもできます。

この「母集団を構成する要素が、特殊な数値を持っていない」という性質は、アンケートの結果分析とノンパラメトリック検定の関係にとって重要になるので、覚えておくといいでしょう。

代表的なパラメトリック「t検定」とは

パラメトリック検定で最もよく知られているのはt検定です。

t検定では、平均と特定の要素の数値を比較します。

t検定の結果、ある要素の数値は「平均と近い」または「平均から離れている」と導くことができます。

この考え方をアンケートの結果分析に応用すると次のようになります。

●アンケートの結果、「30代の独身男性はチョコレートをあまり買わない」という平均的な傾向が出た

●回答者Aは32歳の独身でチョコレートをほとんど買わない:平均と近い

●回答者Bは35歳の独身でチョコレートを毎日買う:平均と遠い

t検定をアンケートの結果分析に使ってみる

この結果が得られると、マーケターは例えば、次のような調査に乗り出すことができます。

●回答者Aの購買行動は平均に近いので、平均の傾向が正確に把握できれば、この人の行動を深掘りして調べる必要はない

回答者Aを追跡調査しても得られる気づきは小さいはずだ、と判断できる

●回答者Bの購買行動は平均から遠いので、なぜこのような行動に出るのか、深掘りして調べる必要がある

回答者Bを追跡調査すれば新たな気づきが得られるかもしれない、と期待できる

t検定を実施すると、深いマーケティング・リサーチを展開することができます。

なぜアンケート分析ではノンパラメトリックが必要になるのか

さて、この記事の目標は、アンケートの結果分析でノンパラメトリック検定を行う意義を検証することです。

しかし、先ほど、パラメトリック検定の1つであるt検定を使ってアンケートの結果分析をすれば「回答者Aを追跡調査しても得られる気づきは小さい」「回答者Bを追跡調査すれば新たな気づきが得られる」という知見が得られることを紹介しました。

パラメトリック検定でこれほどの知見が得られるのに、なぜわざわざノンパラメトリック検定を行う必要があるのでしょうか。

アンケート結果は特殊な数値が重要だから

パラメトリック検定を行うには、母集団が正規分布になっている必要があります。つまり、母集団が正規分布になっていないと、パラメトリック検定は使えません。

しかしアンケート結果は、正規分布になることも、ならないこともあります。

さらにいえば、アンケートの結果分析では、正規分布になっているときでも、特殊な数値を無視してはいけない場合があります。

アンケート結果が正規分布ではないとき、パラメトリック検定は使えないので、ノンパラメトリック検定を使います。

アンケート結果が正規分布になっているものの、特殊な数値を持つ回答者を分析するには、やはりノンパラメトリック検定が必要になります。

ノンパラメトリックの種類

ノンパラメトリック検定は、母集団の分布に法則性がないときに使います。

もしくは、「母集団はこうだろう」という仮定を設定しないで分析する方法を、ノンパラメトリック検定といいます。

カイ2乗検定「観測と期待のズレを求める」

ノンパラメトリック検定の1つに、カイ2乗検定があります。

カイ2乗検定は本来、複雑な数式で定義されますが、ここでは極力数式を使わずに易しく解説します。

カイ2乗検定は、観測度数と期待度数のズレの大きさを測定する手法です。

例えば、チョコレートとアイスクリームに関するアンケートが、次のような結果になったとします。

<観測度数>

好き嫌い
チョコレート13人17人30人
アイスクリーム5人15人20人
18人32人50人

この表の数値は観測したままのものなので、観測度数になります。

ここから期待度数を割り出していきます。

期待度数とは「実際の測定値とは異なる、期待される数値」のことです。

チョコレートもアイスクリームも、スイーツといえます。

つまりこのアンケート結果からは、スイーツが好きな人は「18人/50人=36%」、スイーツが嫌いな人は「32人/50人=64%」であることがわかります。

すると次の点が気になると思います。

●「スイーツ人気」と比べたとき「チョコレート人気」と「アイスクリーム人気」はどのようになっているのだろうか

言い換えるとこうなります。

●「スイーツ人気」と「チョコレート人気またはアイスクリーム人気」にはズレがあるのだろうか

「チョコレート人気またはアイスクリーム人気」と「スイーツ人気」の間にズレが生じていることが確認できれば、チョコレートの販促方法とアイスクリームの販促方法を強化したり修正したりすることができます。

「チョコレート人気とアイスクリーム人気」は両方ともスイーツなので「スイーツ人気」と似た傾向を示すと「期待」できます。

もし、チョコレートもアイスクリームも「好き36%」「嫌い64%」だとすると、次のような結果が「期待」できます。

<期待度数>

好き嫌い
チョコレート10.8人(30人の36%)19.2人(30人の64%)30人
アイスクリーム7.2人(20人の36%)12.8人(20人の64%)20人
18人(50人の36%)32人(50人の64%)50人(100%)

観測度数の表と期待度数の表を合体させ、その差を取ってみます。

ここから、次のことがわかります。

●チョコレートは、期待されていたより「好き」と回答した人が多かった

●アイスクリームは、期待されていたより「嫌い」と回答した人が多かった

実際のカイ2乗検定では、ここから「差=観測度数-期待度数」を2乗して、期待度数で割る計算をします。そして、4つすべての「差の2乗÷期待度数」を足したものを「カイ2乗値」として算出し、それを「カイ2乗分布表」と比較します。

カイ2乗値とカイ2乗分布表の比較が、観測度数と期待度数のズレになります。

まとめ~深層心理を探るようなもの

例えば、ある人が「私は魚は好きだが肉は嫌い、チョコレートは好きだがアイスクリームは嫌い」と言った場合、そこに理由も法則もないような気がします。

しかし、その人の深層心理を探ると「だからこの人は魚とチョコレートを好み、肉とアイスクリームを嫌うのか」ということがわかります。

アンケートの結果分析でノンパラメトリック検定を行うのも、これに似ています。

アンケート結果の数値だけでは、母集団の意向がつかめない場合があります。そのようなとき、ノンパラメトリック検定を実行すると、意外な結果がみえてきます。

アンケート結果のなかに隠れている貴重な情報を抜き出すことができれば、マーケティングの参考になるはずです。

無料お役立ち資料フォーム


<参考>

検定とは

アンケートの作成と分析の基本

正規分布の分かりやすいまとめ

t検定とは?種類と手順を解説!

パラメトリック手法とノンパラメトリック手法の違い

カイ二乗検定( x2検定)について優しく図解!わかった気になる

カイ二乗検定とは