「テキストマイニング」とは、企業ユースとしては、 主に、コールセンターやWebサイトなどに寄せられた 顧客の意見や感想、クレームなどの 「生の声」 を分析する方法です。
「生の声」は、「自然文」です。
すなわち、語られた言葉そのままの文章。
このため、そのままでは、
「満足という回答は、55%、不満足は45%」
といった数値で把握すること(定量化)が困難です。
ですから、こうした生の声は、
「定性情報(データ)」
と呼ばれています。
逆に、アンケート調査のように、
設問に対する答えが、
1.はい
2.いいえ
といった選択肢で示されていて、
数字(1or2)の数値データとして扱うことができ、
集計・分析が容易なものを
「定量情報(データ)」
と呼んでいます。
さて、「テキストマイニング」ですが、
その本質は、端的に言えば次のようになります。
「生の声」(自然文)という
「定性情報」を「定量情報」化すること
定性情報を定量化する具体的な手順は、
技術的・専門的になりすぎますので説明は省きます。
むしろ、実際にどんな分析結果が
テキストマイニングから得られるのかをご紹介します。
出典は、テキストマイニングの活用面に焦点を当てた新刊、
『顧客の声マネジメント テキストマイニングで本音を「見る」』(三室克哉・鈴村賢治・神田晴彦共著、オーム社)
からです。(分析に詳しくない方にも理解しやすい良書ですよ。)
なお、以下の分析例は、化粧品クチコミ情報サイト
「@コスメ」のデータを利用したものです。
肌とか化粧関連の言葉が出てきてますね。
テキストマイニングでまず最初に行う分析は、
「単語分析」
です。
具体的には、生の声の中から、
「単語」を抽出し、その出現頻度をカウントします。
(単語出現件数ランキング例)
順位 / 単 語 / 品詞の種類 / 頻度(件)
1位 / 使う / 動詞/ 2503
2位 / 良い / 形容詞 / 1300
3位 / 肌 / 名詞 /992
これは、人々がどんな単語を多く口にしているかの
全体傾向をつかむための「定量化」(頻度のランキング)
ですね。
つぎに行うのが
「係り受け分析」
です。主語と述語の関係を取り出します。
これは、ユーザーが、何(主語)に対してどんなこと(述語)
を言っているかの「組み合わせ」を把握するということです。
(係り受けランキング例)
順位 / 係り受け / 頻度(件)
1位 / 香り・良い / 90
2位 / 香り・好きだ / 73
3位 / 香り・リラックスする / 10
上の分析例を見ると、特定の化粧品に対する声として、
「香りが良い」(90件)と書いている人がもっとも多く、
次に「香りが好きだ」(73件)という答えが続いていると
いうことがわかります。
次のページ「クロス分析」
続きは会員限定です。無料の読者会員に登録すると続きをお読みいただけます。
- 会員登録 (無料)
- ログインはこちら
関連記事
2007.11.20
2008.09.26
有限会社シャープマインド マーケティング・プロデューサー
これからは、顧客心理の的確な分析・解釈がビジネス成功の鍵を握る。 こう考えて、心理学とマーケティングの融合を目指す「マインドリーディング」を提唱しています。