Excelを使ったテキストマイニング

普段から業務としてExcelを使用する機会がある方は多いでしょう。だからこそ、Excelを使ってテキストマイニングができれば便利ですよね。

今回は、エクセルを用いるテキストマイニングについて特徴や工程、向いている分析内容は何か、何ができないのかなど、詳しく解説していきます。

Excelを使ったテキストマイニングの特徴

Excel単体でのテキストマイニングには限界がある

Excelでのテキストマイニングは、Excelのみで完結することはできません。Excelでできるテキストマイニングはあくまでも単語の集計のみです。

データ収集や分析結果の可視化については、アドインや他のソフトを使用する必要があります。

指定した単語の集計・カウント分析が可能

Excelの関数を使用することにより、テキスト内で対象となる単語のカウントや分析が可能となります。

主な関数を3つ紹介します。

SUM関数

指定した範囲の数値を合計するもので、Excelで最も基本的な関数の1つです。他の関数と組み合わせて使用することもあります。

テキストマイニングでは特定の範囲内の単語がいくつあるかについて集計できます。

INDEX関数

指定した位置のセルの値を表示します。単独で使うことが少なく、他の関数と組み合わせて使用するのが一般的です。

テキストマイニングではSUM関数と組み合わせることで、指定したセルからINDEX関数で指定した範囲の合計値を求めることが出来ます。

COUNTIF関数

単語の集計に使用する関数です。指定した単語を含むセルの個数を数える機能を持ち、アンケートの単一回答を集計するケースに適しています。

あくまでも指定した単語をカウントするだけであり、複雑なデータに対応できません。

テキストマイニング方法を解説した動画や本が豊富

Excelでのテキストマイニングについては、その方法を解説する入門本・教則本や動画が多くあるのも特徴です。

動画は無料で見られる物もあり、まずは費用を掛けずにテキストマイニングを試してみたい方にもおすすめです。

Excelでテキストマイニングするのに必要な準備

Excelによるテキストマイニングには、次の4つの工程が必要となります。

  1. 分析対象のデータを用意
  2. 自然言語処理・データ形成
  3. 単語の集計
  4. 可視化

それぞれの工程について紹介します。

①分析対象のデータを用意

まずは、分析対象となるデータを用意します。データはアンケートの回答データやエクセルデータなどが挙げられます。

②自然言語処理・データ形成

次に、データから分析対象となる文章を単語に分解する自然言語処理を行います。自然言語処理には、品詞に分解する形態要素解析や同義語をまとめる意味分析などがあります。

この作業はExcelではなく、形態要素解析エンジンであるMeCabやJanomeを用いて行います。このとき、「メモリー」「メモリ」などの表記ゆれを修正・統一することも必要です。

③単語の集計

Excelの関数を用いて単語を集計します。シンプルなカウントであればExcelの関数でも対応できますが、アンケートの感想など複雑な表現になればExcelと連携して使用できる集計用ソフトを使用することも考えましょう。

④可視化

Excelによるテキストマイニングを可視化する方法として、ワードクラウドがあります。ワードクラウドは統計データや単語を頻度に応じた大きさで図に表すものです。グラフとは異なり、文字自体の大きさや色によって視覚的に把握することが出来ます。

ワードクラウドをExcelで作成する場合も、フリーソフトまたはアドインが必要となります。

ビッグデータの分析・活用

インターネットで収集しやすいテキストデータには、SNSやブログ、掲示板の書き込みなどが挙げられますが、これらはリアルタイム性が高い有用なビッグデータであるといえます。これらのデータを分析することによって、企業では自社が提供している製品やサービスに関する感想や評判、売れ行き予測といったものを探ることが可能といえるでしょう。

Excelはどんな人に向いている?

Excelで可能なテキストマイニングは、基本的に単語の出現頻度をカウントするだけです。その後はワードクラウドなどで分析結果を可視化する必要があり、手間がかかります。また、精度や実施範囲が限られてしまうという点もデメリットです。

ただし、Excelによるテキストマイニングには専用のソフトを必要としません。特定の単語・区切られた単語をカウントするだけのシンプルな結果を求めるのであれば、Excelによるテキストマイニングはおすすめです。

Excelでテキストマイニングを行うメリット

Excelでテキストマイニングを行う場合には、下記のようなメリットが期待できます。

現在、仕事でエクセルを使用しているといった企業も多いでしょう。この場合、テキストマイニングを行う際にExcelを使用する、ということになれば改めて分析のためのツールを購入する必要がありません。このことから、テキストマイニングを行うにあたりコストがかからない、という点は大きなメリットとなる可能性があります。例えば費用をかけずにテキストの分析を行いたいと考えている場合には、Excelがおすすめのツールといえます。

また、Excelでテキストマイニングを行う場合には関数を入力する必要があります。これまでExcelの関数を使用してきており扱いに慣れている方であれば、その知識を活かしてテキストの分析を進められる点もメリットのひとつと感じられるでしょう。

Excelでテキストマイニングを行うデメリット

Excelでテキストマイニングを行う場合には、メリットがある反面下記のようなデメリットも考えられます。

Excelでのテキストマイニングでは、前述のように関数を使ってテキストの分析を進めていくという流れになります。このことから、Excelの関数を使い慣れている人であれば特に問題にはなりませんが、これまで関数を使ったことがない人や使い慣れていない人にとってはこの部分が大きな壁になってくる可能性もあります。関数を覚える手間、入力する手間などがかかるといった点が想定されるため、Excelでテキストマイニングを行う場合にはあらかじめよく使用する関数について学んでおくことも必要となってきます。

また、他のツールを使用したテキストマイニングと比較した場合には、分析できる範囲が狭かったり精度があまり高くないといったケースも考えられます。そのため、幅広く分析をしたい、また分析の精度を上げたいといった要望がある場合には専用のツールを使用することがおすすめです。

無料ツールと有料ツールの違いは?

Excelのような無料ツールでのテキストマイニングは、利用できる機能が少ない、分析方法が限定的であるといった点がデメリットとして挙げられます。

一方、有料ツールは辞書機能が充実していることで必要な形でのテキスト分割など高い精度での分析が可能となる、分析前後に必要な工程サポートやデータを取り込むだけで分析が出来るといった便利な機能が利用できます。

導入や運営時にサポートが受けられるものもあるので、より高い精度や様々な種類での分析を求めるのであれば、有料版ツールを検討してみましょう。

おすすめの
テキストマイニングツールを
特徴ごとに確認する

Excelの提供会社

社名 日本マイクロソフト株式会社
本社所在地 東京都港区港南 2-16-3 品川グランドセントラルタワー
電話番号 03-4332-5300
公式HP URL https://www.microsoft.com/ja-jp/

おすすめの
テキストマイニングツール3

ツールごとに機能やサービス内容が様々あるテキストマイニングツール。トライアル版を出しており、アンケートやリサーチから依頼ができるツール3つを紹介いたします。

「誰でも分析できる」
をコンセプトに設計

YOSHINA

(株式会社レトリバ)
YOSHINA
引用元:https://yoshina.retrieva.jp/
  • 専門知識や面倒な初期設定なしに分析が始められる。
  • 実務経験がない担当者の分析実績あり (※1)

YOSHINAの
無料デモ体験を申し込む

電話で問い合わせてみる

YOSHINAの
詳細を見てみる

自動辞書
テキストマイニング

TextVoice

(マイボイスコム株式会社)
TextVoice
引用元:https://www.textvoice.jp/info/
  • 類義語を自動で辞書に登録ができる
  • 最大6つの言葉をかけあわせて、分析ができる

TextVoiceの
無料デモ体験を申し込む

電話で問い合わせてみる

TextVoiceの
詳細を見てみる

Twitterデータ提供サービス認定
サービスプログラム

見える化エンジン

(株式会社プラスアルファ・
コンサルティング)
見える化エンジン
引用元:https://www.mieruka-engine.com/
  • 15億件 (※2)という膨大なデータを取り込むことが可能
  • Twitter社の認定サービス (※3)
    のため
    Twitterの分析に強い

見える化エンジンの
無料デモ体験を申し込む

電話で問い合わせてみる

見える化エンジンの
詳細を見てみる

※Google検索「テキストマイニングツール」の上位16社(2022年10月時点)の中から選定。