アンケート テキストマイニング

テキストマイニングでアンケートの自由記述から重要な情報を発掘

アンケートの質問を作成するときに、「客観的なデータが得られない」、あるいは「集計しづらい」といった理由で自由記述を設定していないマーケターはいないでしょうか。

自由記述に書かれる回答には、マーケターたちの想像を超える知見や気づきが含まれることがあるもの。したがって自由記述の設問は積極的に活用することが大切です。

客観性がない、集計が面倒という自由記述の欠点は、テキストマイニングという技術を使うと、効率的かつ効果的に集計することができます。

テキストマイニングとは

マイニングは「採掘」という意味を持つ言葉。そして、テキストマイニングとは、文章(テキスト)に含まれていながら表出されにくい情報を引き出す技術のことをいいます。

1人が1つの文章を読んでそこに書いてある情報を抜き出すことは簡単です。しかし、1人が1,000人の文章を読み、そのなかに書かれてある情報をまとめることは難しく、そして、1人が1,000人の文章を読む場合、本当は必要な情報を捨ててしまうかもしれません。それでは自由記述が無駄になってしまいます。

そのようなときにテキストマイニングを使うと、大量の文章から傾向や法則を客観的かつ正確に引き出すことができます。

テキストマイニングのアナログなやり方

テキストマイニングには、アナログなやり方とデジタルなやり方があります。

最初に、アナログ方式から紹介します。

アナログといっても、エクセルは使います。

まずは、自由記述の回答をエクセルに転記していきます。例えば次のように作成します。

テキストA、B、C、Dは、それぞれの回答者が自由記述欄に書いた文章です。実際は、テキストA、B、C、Dに、自由記述の文章を入力します。

自由記述の文章性別年齢年収
テキストA45500万円台
テキストB32400万円台
テキストC25300万円台
テキストD55600万円台

自由回答の文章の横に、性別や年齢、年収などの属性を記述します。

ここまで準備すると、次のようなテキストマイニングを行うことができます。

●テキストマイニングその1:男性だけの情報を集める

男性の意見だけを調査したい場合、上記のエクセルを下記のように加工すると必要な情報だけ抜き出すことができます。

自由記述の文章性別年齢年収
テキストA45500万円台
テキストC25300万円台

同じやり方で、40歳以上の情報だけを調査することも、年収500万円以上の人の意見を収集することもできます。

●テキストマイニングその2:キーワードを探す

エクセルを使うと、テキストのなかにある、特定の単語が何回出てくるかを数えることができます。

例えば、以下のテキストはある日の日本経済新聞のサイトから抜粋したものです。このなかに「コロナ」という単語は7回出てきます。

新型コロナウイルスの関連ニュースをこちらでまとめてお読みいただけます。ワクチン・治療薬 休業・補償 ビジネス 国内 海外 感染状況高齢者、ワクチンを1回でも接種した人は2.5%15:57更新
65歳以上の高齢者に占める「ワクチンを少なくとも1回接種した人」の割合は16日時点で対象者の2.5%にあたる91万人だった。…続き病床使用率、20府県がステージ4相当 感染指標を見る10:10更新
大阪や京都、兵庫、愛知、岡山、広島、福岡など20府県で、新型コロナウイルス感染者用の病床使用率は50%以上の「ステージ4」相…続き緊急事態宣言、9都道府県に拡大 ビジュアル解説11:39更新
政府は新型コロナウイルスの緊急事態宣言の対象に北海道、岡山、広島の3道県を追加すると決めた。宣言地域はすでに対象の6都府県と…続きコロナ国内感染、新たに3677人確認 累計68万8392人22:36更新
国内で新型コロナウイルスの感染が拡大している。各自治体などによると、17日は午後8時までに新たに3677人の感染が確認され、…続き大阪のコロナ累計死者数1958人、東京を上回る10:18更新
16日に国内で新たに確認された新型コロナウイルスによる死者は47人だった。大阪府が15人、東京都は0人で首都圏1都3県は計1…続きインドの1日の感染者34万人、ピークから1割減10:08更新

人がテキストのなかの単語を数えると数え間違いが起きますが、エクセルで以下の関数を使うと、正確に「コロナ=7回」を導き出すことができます。

=SUM(LEN(範囲)-LEN(SUBSTITUTE(範囲,”文字列”,””)))/LEN(“文字列”)

「範囲」にテキストが入っているセル番号を入れます。「文字列」に数えたい単語を入力します。

頻出する単語は、アンケート回答者の関心が高い項目であることがわかります。

●テキストマイニングその3:長い文章から読む

テキストの文字数が、Aは30字、Bは200字、Cは150字、Dは300字だったとします。

文字数はエクセルの関数を使えば簡単に出すことができます。

文字数がわかったら、エクセルを文字の多い順に並べ替えます。以下のようになります。

自由記述の文章文字数性別年齢年収
テキストD30055600万円台
テキストB20032400万円台
テキストC15025300万円台
テキストA3045500万円台

自由記述の文字数が多いということは、回答者がそれだけ熱心に書いたことを意味するので、より重要な情報が含まれていると推測することができます。

そこで、上から順に読むことで、効率よく重要な情報を収集できるようになります。

テキストマイニングのデジタルなやり方「AIを使う」

テキストマイニングのデジタルなやり方は、AI(人工知能)を使う方法です。

例えば自由記述で次のような文章があったとします。

今日はチーズケーキを買いました。値段が少し高いなと思いましたが、こちらの店のことを信頼していたので、高いのであればそれだけ味がよいと思い、迷わず家族分を買いました。案の定、家族全員が喜んでくれました。私もとてもおいしかったと思います。また買いにきますね。

AIテキストマイニングの「意見タグ」という機能を使うと、上記の文章を次のように整理することができます。

●買った商品: チーズケーキ

●値段の感想:高い

●店への感想:信頼

●購入個数:家族分買った

●家族の感想:喜んだ

●私の感想:おいしかった

●次回:買う

AIがここまで人の自由な文章を要約できるのは、主語や述語、目的語、形容詞などを把握できるからです。

またAIは、総合的にポジティブな感想なのかネガティブな感想なのかまで判定します。それはAIが文章のニュアンスを読み取ることができるからです。

すべての回答者の自由記述を上記のように要約していけば、次のことがわかります。

●多く買われた商品

●多く買われ、なおかつ評価が高い商品

●多く買われたが、評価が低い商品

●あまり買われなかったが、評価が高い商品

●あまり買われず、なおかつ評価が低い商品

●価格への評価(高いと感じている人が多いか、安いと感じている人が多いか)

●誰が誰のために買っているか

●来店動機

●リピートにつながりそうな要素

●店を好意的に思っているかどうか

テキストマイニングで得られる知見や気づきとは

ITが得意でない企業が、独自にテキストマイニングAIを構築することは難しいため、AIを使ったテキストマイニングは、ほとんどの場合、外部の専門業者に依頼することになるでしょう。

それでも、そこから多くの知見が得られる可能性があるので、アンケート結果から重要情報を引き出せていないと感じているマーケターは、一度試してみることがおすすめです。

しかし、AIテキストマイニングを専門業者に依頼するとコストがかかるので、まずはアナログ方式のテキストマイニングから試してみてください。

主観に任せて採掘しないこと

アナログ方式でも、エクセルを使って集計することがおすすめです。なぜなら、マーケ―ターが流れ作業的に自由記述を読み進めてしまうと、つい、ポジティブな内容を重要意見としてピックアップしてしまうからです。

それではデータ収集になりません。

どこを気にしているかがわかる

顧客(ここではアンケートの回答者たち)は、意外なことを気にしています。それは、アンケートに自由記述欄を設置しないと、なかなか見抜けないものです。

例えば、ある店が値下げをしたところ売上高があがったので、定期的にセールを開催することになったとします。ところがしばらくすると、セール効果が薄れてしまいました。このとき店長は、直感的に、セールの刺激が薄れてしまったようだ、と考えてしまうでしょう。

しかし、アンケートを実施すると、セールによって来店者が増えたことで、客1人に割く接客時間が減り、それが不満につながっていたことがわかるかもしれません。

この気づきは、アンケートの回答用紙に自由記述欄を設置しないと得られないでしょう。

なぜなら店長は「セールの効果が薄れてしまったから、客足が遠のいたのだろう」と考えているからです。そのような先入観を持っていると、選択肢式の質問では、なかなか「接客が悪くなった」という選択肢を用意できないはずです。

アンケートの選択肢は、どうしてもマーケターの知識や情報によってつくられてしまいます。すなわち、選択肢はマーケターの想像の域を超えません。企業の人は、顧客が気にしているところを意外に知りません。

自由記述欄があれば、回答者は、マーケターの想像に縛られることなく企業に気づきを提供することができます。

あとはテキストマイニングで、その気づきを掘り起こしていけばよいのです。

まとめ~回答者の「伝えたい」気持ちを汲み取ることができる

ロイヤリティの高い顧客のなかには、よりよい企業になってもらいたいという思いから、積極的にアンケートに回答したいと思っている人がいます。

しかし、アンケートの設問が選択肢式だけだと、その思いを伝えられないかもしれません。

アンケートの回答用紙には自由記述を設けて、テキストマイニングの技術で客観的にデータを取る事が大切です。

そういった意味では、テキストマイニングは顧客の心をデータ化する手法と考えることができます。

無料お役立ち資料フォーム