本文へスキップします。

【参】モーダルJS:読み込み
書籍DB:詳細


Excelで学ぶテキストマイニング入門

Excelで学ぶテキストマイニング入門

  • 著者林 俊克
  • 定価2,860円 (本体2,600円+税)
  • 判型B5変
  • 248頁
  • ISBN978-4-274-06493-7
  • 発売日2002/10/23
  • 発行元オーム社

内容紹介

CS分析やCRM、商品開発といった分野を中心に注目されているテキストマイニングの実践的な入門書

テキストマイニングの基礎と簡単な実践を、商品企画開発に即適用できる事例のExcelによる分析を通して解説する入門書。
テキストマイニングは、元になるテキストを形態素解析してキーワード化し、そのキーワードについて出現頻度をヒストグラム化したり、ポートフォリオを作成したり、キーワード間の因果関係を調べたりすることで、役に立つ有益な情報を抽出する手法である。本書では、フリーの形態素解析システム「茶筌」を利用したテキストの解析と、Excelによる簡単なヒストグラム化や因果関係の分析方法を紹介する。また、これまでのテキストマイニングに欠けている「マイニングを見越したテキストデータの収集」、すなわち「定型自由文」についても、アンケートを使った例を用いて実践的に解説する。さらに、Excelでは困難な、より高度なテキストマイニングの手法について、筆者が開発したテキストマイニングシステムを使って解説する。

目次

ダウンロード

 ここでは、本書で使用しているExcelのサンプルデータを圧縮したファイル(sample.zip)と、日本語形態素解析システム「茶筌」の Windows 版である ChaSen version 2.1 for Windowsを圧縮したファイル(cha21244.zip)とを提供しています。sample.zip を利用するには、日本語版 Windows 環境が必要です。cha21244.zip を利用するには、日本語版 Windows95 以降の環境が必要です。
 なお「茶筌」については、開発元である奈良先端科学技術大学院大学 情報科学研究科による 公式ホームページ を参照してください。

  • 本ファイルは、本書をよくお読みの上ご利用ください。
  • サンプルデータの著作権は、本書の著作者である、林俊克氏に帰属します。
  • 茶筌の著作権は、奈良先端科学技術大学院大学に属します。また、茶筌に付属する辞書は ICOT Free Software にて開発された辞書を利用したものです。茶筌の利用にあたっては、添付されているマニュアルに記載されている ICOT Free Software の利用条件も確認してください。
  • 本ファイルを利用したことによる直接あるいは間接的な損害に関して、著作者およびオーム社はいっさいの責任を負いかねます。利用は利用者個人の責任において行ってください。また、ソフトウェアの動作・実行環境、操作についての質問には一切お答えすることはできません。

 奈良先端科学技術大学院大学 情報科学研究科の許可を得て、本書の解説で使用したバージョンの茶筌を提供しています(cha21244.zip)。
 最新版については、公式ホームページ から入手してください。

  • cha21244.zip(日本語形態素解析システム「茶筌」Windows版)
  • sample.zip(日本語版Windows用圧縮ファイル)

正誤表

正誤表はございません。

この商品をシェアする