ここでは、テキストマイニングツールのテキスト解析と分類に使われている「探索的データ解析」と「文書分類」、分析に使われる主な手法「センチメント分析」「対応(コレスポンデンス)分析」「主成分分析」について解説します。
バラバラに書かれた膨大な量のテキストデータを分類/分析する手法をテキストマイニングといい、テキストマイニングツールでは、まず自然言語処理という解析手法を使ってテキストデータを単語に分解します。
探索的データ解析のみをテキストマイニングという場合もありますが、探索的データ解析はテキストマイニングの中の1つの解析方法です。 形態素解析を用いてテキストを単語やフレーズに分解し、関連性、出現頻度、時系列による変化など、様々な視点から分析を行って新しい情報を抽出します。
文書分類とはテキストデータを何種類にも分類すること。「教師あり文書分類」と「教師なし文書分類」の2種類があります。テキストマイニングツールによって、教師あり/なしのどちらでも分析できるものと、どちらか一方しかできないものがあります。
サンプルとなる外部データ情報を参照してテキストデータを分類する方法で、分類器を使って分類します。分類器とは事前にテキストと振り分け先の関係を学習させたもので、沢山学習をさせるほど、分類の精度が上がります。
サンプルとなる外部データ情報を参照せずにテキストデータを分類する方法で、類似した特徴ごとにテキストを分類するクラスタリングによって分類されます。教師あり文書分類の分類器のような事前準備は必要なく、テキストデータだけで分類できます。
自社のビジネスで、より戦略的に顧客の声を活用していきたいのなら、分析機能が豊富で、結果につなげやすい有料のテキストマイニングツールもぜひチェックしてみましょう。
以下のページでは、おすすめのテキストマイニングツールを「コスパ」「教育」「知名度」の3つの軸で比較。おすすめの3つを紹介しています。
分解されたテキストを使い、どの単語が、どのくらい出現し、時系列で変わっていく変化や相関関係について分析します。
サービスや商品に対する消費者の感情を分析する時に使われる手法で感情分析とも言われ、 あるテーマに関する人の感情を「ポジティブ〈肯定)」「中立」「ネガティブ〈否定)」の3パターンに分類する分析手法です。 消費者がどのような感情を持っているか判定できるのでサービスや商品に対する評価を把握することができます。
リサーチやアンケート結果のクロス集計、集計や編集を行う前のローデータを散布図を用いて提示する分析手法で、項目と項目の関係などを可視化します。 異なるデータの類似点や相違点をビジュアル的に比較できるので、ブランドイメージ分析や競合他社との違いを把握するためなどに利用されています。
ビッグデータなど膨大な量のデータ分析に用いられる手法です。データが膨大になるほど、その中には不要なデータが多く含まれてるので、分析をすることが難しくなります。 主成分分析では、膨大なデータから主成分だけを抽出。分析しやすいデータにとしてまとめていきます。 例えば、複数の論文から必要情報を抽出する場合、SNS上のコンテンツから有益情報を抽出する場合などに使われます。
ツールごとに機能やサービス内容が様々あるテキストマイニングツール。トライアル版を出しており、アンケートやリサーチから依頼ができるツール3つを紹介いたします。
※Google検索「テキストマイニングツール」の上位16社(2022年10月時点)の中から選定。