ここでは、テキストマイニングにかける費用を抑えたい人向けに、無料で使用できるツールを6つ紹介しています。どうしても工数がかかりますが、無料で始められるので試しに使用してみたい方におすすめです。
自社のビジネスで、より戦略的に顧客の声を活用していきたいのなら、分析機能が豊富で、結果につなげやすい有料のテキストマイニングツールもぜひチェックしてみましょう。
以下のページでは、おすすめのテキストマイニングツールを「コスパ」「教育」「知名度」の3つの軸で比較。おすすめの3つを紹介しています。
Excelを用いてテキストマイニングを行うことも可能です。まずは、文書の解析の前に、単語の頻出度を計測できるように文書を単語に分解していく必要があります。 次に、COUNTIF関数を用いて単語を指定して、出現した回数をカウント。 表記ゆれに対応するために単語のカウント条件を複数指定する場合は、複数条件をカウントできるCOUNTIFS関数を使用してみてください。
ビジネスで広く利用されているExcelだけに、Excelを使ったテキストマイニングはさまざまな書籍・Webサイト・動画などで解説されています。特にWebサイトや動画は無料で利用できるものもあり、手軽にやり方を習得可能です。具体的な例を示している解説も多く、やりたい内容と合致する解説を見つけられればすぐにテキストマイニングできるでしょう。一方、解説内容の正確さにこだわるなら書籍や有料のコンテンツがおすすめです。また、発展的な使い方を解説しているものもあり、Excelでのテキストマイニングを極めたい方にも適しています。
上述した手順通りに進めたら、最後にどの単語の頻出度が高いのか可視化するために、 ワードクラウドを作成しましょう。ワードクラウドをExcelで作成する場合は、別途プログラムをインストールしなければなりません。 2013年以降のExcelに対応している「E2D3」のアドインを追加すると、簡単に作図できるのでおすすめ。 ただし、Excelで集計する場合は、フリーアンサーのような自然言語に対応しづらいという側面があるので注意が必要です。
開発元企業 | 日本マイクロソフト株式会社 |
---|---|
本社所在地 | 東京都港区港南 2-16-3 品川グランドセントラルタワー |
電話番号 | 03-4332-5300 |
公式HP URL | https://www.microsoft.com/ja-jp/ |
KHコーダーは、Windows・Macともに無料で使用可能なテキストマイニングツール。 使用する場合は、まずは公式サイトからインストールして解凍し、デスクトップに作成されたアイコンを起動させます。 続いて、データの分析作業に移りますが、データを読み込む際は事前に、エクセルへのデータ入力が必要です。 1つ目のシートの1行目に列の名前、2行目以降にテキストを入力して、データを整理しましょう。
上記のようにデータを整えたら、KHコーダーのプロジェクトからエクセルを開き、強制抽出する単語を指定します。 抽出したい単語を設定したら前処理を行い、いよいよ分析作業を始めます。 強制抽出に指定した単語はもちろんのこと、設定していない単語も抽出。抽出した単語の中から気になるものがあれば、クリックをして前後の文脈を確認することも可能です。
無料ソフトというと安全性が気になるかもしれませんが、KHコーダーは分析にインターネット接続を必要とせず、ローカル環境でテキストマイニングをおこなえます。ネット接続が必要なソフトの場合はどんな通信をおこなっているのか把握するのは困難であり、分析内容が接続先で保存されてもわかりません。インターネット接続していないパソコンでKHコーダーを利用すれば情報漏洩のリスクを下げられます。さらに有料の「KH Corder サポートパッケージ」では独自のセキュリティチェック機能が備わっており、より安心して利用可能です。
著作権 | 樋口耕一 |
---|---|
本社所在地 | 記載なし |
電話番号 | 記載なし |
公式HP URL | https://khcoder.net/ |
自社のビジネスで、より戦略的に顧客の声を活用していきたいのなら、分析機能が豊富で、結果につなげやすい有料のテキストマイニングツールもぜひチェックしてみましょう。
以下のページでは、おすすめのテキストマイニングツールを「コスパ」「教育」「知名度」の3つの軸で比較。おすすめの3つを紹介しています。
統計ソフトRは、無料で使用できるデータ分析のサービスです。テキストマイニングを行えますが、別途、テキストマイニングツールが必要。 テキストマイニングツールと統計ソフトR、さらには補助ソフトのRStudioをまずはインストールしておきます。 テキストマイニングツールとしては、本ページで紹介されているものを使用するのも手です。
統計ソフトRは、解析時にコードの入力が必要です。read_table関数やwrite、csv関数を用いて、実行・出力を行いましょう。 単語の出現頻度をカウントしたり、単語出現回数をマトリクスに表示したりすることも可能。 また、wordcloud::wordcloud関数を用いれば、結果を可視化できるワードクラウドの作成もできます。
統計ソフトRが利用するR言語は統計解析やグラフィック分に特化したプログラミング言語であり、書籍やインターネット上に豊富な解説が存在しています。無料で利用できるコンテンツも多く、困ったときにすぐに解決方法を検索可能です。さらに、R言語を学べるプログラミングスクールも多く存在しており、仕事で本格的に使う必要が出てきたらそのようなスクールを利用してもよいでしょう。完全オンラインで受講できるスクールもあり、気軽にはじめられます。
開発者 | Ross Ihaka と Robert Clifford Gentleman |
---|---|
本社所在地 | 記載なし |
電話番号 | 記載なし |
公式HP URL | https://www.r-project.org/ |
MeCabは、無料で使用できる形態素解析エンジンです。 形態素解析、文書を単語に分解する分かち書きに使用されています。 CRFの学習モデルを採用しており、辞書の情報量(コーパス)が少なくても形態素解析が可能。 解析エンジンのChaSenと比べても、3分の1程度の情報量で解析ができると言われています。
MeCabを使えば、分解した単語の頻出量を計測したり、頻出量を基にグラフ化したりすることが可能。 さらに、高度なデータ分析をする場合は、統計ソフトRのようなデータ分析のツールと組み合せて使用する必要があります。 辞書やノイズが含まれているかによって形態素解析の精度が変わるため、記号などは極力取り除かないと、思うように解析できない可能性があるので注意しましょう。
MeCabは単体で利用できるほか、各種プログラミング言語と連携できます。そのなかには、
といったものがあり、主要なプログラミング言語はすべて網羅されているといってよいでしょう。自社で開発しているソフトやアプリにMeCabを組み合わせれば画期的なサービスや機能につなげられるかもしれませんし、より自社の用途やデータにカスタマイズされたテキストマイニングツール作りにも役立てられます。
開発者 | 工藤拓 |
---|---|
本社所在地 | 記載なし |
電話番号 | 記載なし |
公式HP URL | http://taku910.github.io/mecab/ |
自社のビジネスで、より戦略的に顧客の声を活用していきたいのなら、分析機能が豊富で、結果につなげやすい有料のテキストマイニングツールもぜひチェックしてみましょう。
以下のページでは、おすすめのテキストマイニングツールを「コスパ」「教育」「知名度」の3つの軸で比較。おすすめの3つを紹介しています。
JUMANは、形態素解析が行える無料のツールです。文書を解析すると、形態素・読み・原型・品詞といった順に出力されます。非反復形オノマトペや長音記号による非標準表記、 長音記号や小書き文字を用いた長音化の自動認識機能などを実装。話し言葉で出現する、「ー」や「ぁ」といった文字まで自動認識してくれるため、単語として抽出することが可能です。
JUMANは、Webから抽出した辞書を使用しており、単語を細かく分類できるのが特徴です。 文字コードのUTF-8に対応しており、解析した単語はカテゴリ別に分類して表示することが可能。 MeCab同様に、形態素解析に特化したツールのため、データ分析には他のツールを使用する必要があります。
JUMANを開発している京都大学黒橋・褚・村脇研究室は、JUMANのほかに構文解析ツール「KNP」を開発しています。このKNPはJUMANの解析結果を入力として動作するものであり、JUMANが解析した形態素に対してそれらの関係を図式化するものです。同じ研究室で開発されたツールだけに、シームレスに連携できます。KNPもWebから自動構築した大規模格フレームを利用しており、これらの組み合わせは比較的新しい文章にも対応可能。さまざまな応用ができるでしょう。
開発者 | 京都大学黒橋・褚・村脇研究室 |
---|---|
本社所在地 | 記載なし |
電話番号 | 記載なし |
公式HP URL | https://nlp.ist.i.kyoto-u.ac.jp/?JUMAN |
UserLocalテキストマイニングは、無料で使用できるクラウド型のテキストマイニングサービスです。 使い方がシンプルで、公式サイトのフォームにテキストを入力するか、あるいはテキストデータをアップロードするだけで簡単に解析可能。 無料で使用したいが、コードの入力やインストールの手順が分からないという方でも、すぐに使い始めることが可能です。
UserLocalテキストマイニングは、ビジネス向けの機能を搭載した有料のサービスも登場しています。 有料サービスでは、人工知能を用いたAIテキストマイニングが可能。 感情分析にも対応しており、無料版よりも精度の高いテキスト分析を実施できます。 また、ワードクラウドや出現頻度分析、共起ネットワークの作成も可能です。
テキストマイニングに欠かせない前処理ツールが充実しているのもUserLocalテキストマイニングの特徴です。そのなかには「整形ツール」と呼ばれる、特定の形式のテキストをテキストマイニングに整形するツールがあります。Amazonや楽天市場などのレビューや特許文献を整形できるほか、カスタマイズにより任意の形式での整形も可能です。また、有料ながらAIが自動的にテキストに含まれる個人情報を匿名化するツールも存在。情報漏洩のリスクをあらかじめ下げてテキストマイニングをおこなえます。
開発元企業 | 株式会社ユーザーローカル |
---|---|
本社所在地 | 東京都品川区大崎2丁目11-1 4F |
電話番号 | 記載なし |
公式HP URL | https://textmining.userlocal.jp/ |
KHコーダーは、Windows・Macともに無料で使用可能なテキストマイニングツール。 使用する場合は、まずは公式サイトからインストールして解凍し、デスクトップに作成されたアイコンを起動させます。 続いて、データの分析作業に移りますが、データを読み込む際は事前に、エクセルへのデータ入力が必要です。 1つ目のシートの1行目に列の名前、2行目以降にテキストを入力して、データを整理しましょう。
上記のようにデータを整えたら、KHコーダーのプロジェクトからエクセルを開き、強制抽出する単語を指定します。 抽出したい単語を設定したら前処理を行い、いよいよ分析作業を始めます。 強制抽出に指定した単語はもちろんのこと、設定していない単語も抽出。抽出した単語の中から気になるものがあれば、クリックをして前後の文脈を確認することも可能です。
著作権 | 樋口耕一 |
---|---|
本社所在地 | 記載なし |
電話番号 | 記載なし |
公式HP URL | https://khcoder.net/ |
自社のビジネスで、より戦略的に顧客の声を活用していきたいのなら、分析機能が豊富で、結果につなげやすい有料のテキストマイニングツールもぜひチェックしてみましょう。
以下のページでは、おすすめのテキストマイニングツールを「コスパ」「教育」「知名度」の3つの軸で比較。おすすめの3つを紹介しています。
ツールごとに機能やサービス内容が様々あるテキストマイニングツール。トライアル版を出しており、アンケートやリサーチから依頼ができるツール3つを紹介いたします。
※Google検索「テキストマイニングツール」の上位16社(2022年10月時点)の中から選定。