普段から業務としてExcelを使用する機会がある方は多いでしょう。だからこそ、Excelを使ってテキストマイニングができれば便利ですよね。
今回は、エクセルを用いるテキストマイニングについて特徴や工程、向いている分析内容は何か、何ができないのかなど、詳しく解説していきます。
Excelでのテキストマイニングは、Excelのみで完結することはできません。Excelでできるテキストマイニングはあくまでも単語の集計のみです。
データ収集や分析結果の可視化については、アドインや他のソフトを使用する必要があります。
Excelの関数を使用することにより、テキスト内で対象となる単語のカウントや分析が可能となります。
主な関数を3つ紹介します。
指定した範囲の数値を合計するもので、Excelで最も基本的な関数の1つです。他の関数と組み合わせて使用することもあります。
テキストマイニングでは特定の範囲内の単語がいくつあるかについて集計できます。
指定した位置のセルの値を表示します。単独で使うことが少なく、他の関数と組み合わせて使用するのが一般的です。
テキストマイニングではSUM関数と組み合わせることで、指定したセルからINDEX関数で指定した範囲の合計値を求めることが出来ます。
単語の集計に使用する関数です。指定した単語を含むセルの個数を数える機能を持ち、アンケートの単一回答を集計するケースに適しています。
あくまでも指定した単語をカウントするだけであり、複雑なデータに対応できません。
Excelでのテキストマイニングについては、その方法を解説する入門本・教則本や動画が多くあるのも特徴です。
動画は無料で見られる物もあり、まずは費用を掛けずにテキストマイニングを試してみたい方にもおすすめです。
Excelによるテキストマイニングには、次の4つの工程が必要となります。
それぞれの工程について紹介します。
まずは、分析対象となるデータを用意します。データはアンケートの回答データやエクセルデータなどが挙げられます。
次に、データから分析対象となる文章を単語に分解する自然言語処理を行います。自然言語処理には、品詞に分解する形態要素解析や同義語をまとめる意味分析などがあります。
この作業はExcelではなく、形態要素解析エンジンであるMeCabやJanomeを用いて行います。このとき、「メモリー」「メモリ」などの表記ゆれを修正・統一することも必要です。
Excelの関数を用いて単語を集計します。シンプルなカウントであればExcelの関数でも対応できますが、アンケートの感想など複雑な表現になればExcelと連携して使用できる集計用ソフトを使用することも考えましょう。
Excelによるテキストマイニングを可視化する方法として、ワードクラウドがあります。ワードクラウドは統計データや単語を頻度に応じた大きさで図に表すものです。グラフとは異なり、文字自体の大きさや色によって視覚的に把握することが出来ます。
ワードクラウドをExcelで作成する場合も、フリーソフトまたはアドインが必要となります。
インターネットで収集しやすいテキストデータには、SNSやブログ、掲示板の書き込みなどが挙げられますが、これらはリアルタイム性が高い有用なビッグデータであるといえます。これらのデータを分析することによって、企業では自社が提供している製品やサービスに関する感想や評判、売れ行き予測といったものを探ることが可能といえるでしょう。
Excelで可能なテキストマイニングは、基本的に単語の出現頻度をカウントするだけです。その後はワードクラウドなどで分析結果を可視化する必要があり、手間がかかります。また、精度や実施範囲が限られてしまうという点もデメリットです。
ただし、Excelによるテキストマイニングには専用のソフトを必要としません。特定の単語・区切られた単語をカウントするだけのシンプルな結果を求めるのであれば、Excelによるテキストマイニングはおすすめです。
Excelでテキストマイニングを行う場合には、下記のようなメリットが期待できます。
現在、仕事でエクセルを使用しているといった企業も多いでしょう。この場合、テキストマイニングを行う際にExcelを使用する、ということになれば改めて分析のためのツールを購入する必要がありません。このことから、テキストマイニングを行うにあたりコストがかからない、という点は大きなメリットとなる可能性があります。例えば費用をかけずにテキストの分析を行いたいと考えている場合には、Excelがおすすめのツールといえます。
また、Excelでテキストマイニングを行う場合には関数を入力する必要があります。これまでExcelの関数を使用してきており扱いに慣れている方であれば、その知識を活かしてテキストの分析を進められる点もメリットのひとつと感じられるでしょう。
Excelでテキストマイニングを行う場合には、メリットがある反面下記のようなデメリットも考えられます。
Excelでのテキストマイニングでは、前述のように関数を使ってテキストの分析を進めていくという流れになります。このことから、Excelの関数を使い慣れている人であれば特に問題にはなりませんが、これまで関数を使ったことがない人や使い慣れていない人にとってはこの部分が大きな壁になってくる可能性もあります。関数を覚える手間、入力する手間などがかかるといった点が想定されるため、Excelでテキストマイニングを行う場合にはあらかじめよく使用する関数について学んでおくことも必要となってきます。
また、他のツールを使用したテキストマイニングと比較した場合には、分析できる範囲が狭かったり精度があまり高くないといったケースも考えられます。そのため、幅広く分析をしたい、また分析の精度を上げたいといった要望がある場合には専用のツールを使用することがおすすめです。
Excelのような無料ツールでのテキストマイニングは、利用できる機能が少ない、分析方法が限定的であるといった点がデメリットとして挙げられます。
一方、有料ツールは辞書機能が充実していることで必要な形でのテキスト分割など高い精度での分析が可能となる、分析前後に必要な工程サポートやデータを取り込むだけで分析が出来るといった便利な機能が利用できます。
導入や運営時にサポートが受けられるものもあるので、より高い精度や様々な種類での分析を求めるのであれば、有料版ツールを検討してみましょう。
社名 | 日本マイクロソフト株式会社 |
---|---|
本社所在地 | 東京都港区港南 2-16-3 品川グランドセントラルタワー |
電話番号 | 03-4332-5300 |
公式HP URL | https://www.microsoft.com/ja-jp/ |
ツールごとに機能やサービス内容が様々あるテキストマイニングツール。トライアル版を出しており、アンケートやリサーチから依頼ができるツール3つを紹介いたします。
※Google検索「テキストマイニングツール」の上位16社(2022年10月時点)の中から選定。