本文へスキップします。

【参】モーダルJS:読み込み
書籍DB:詳細

Rによるやさしいテキストマイニング [活用事例編]

Rによるやさしいテキストマイニング [活用事例編]

  • 著者小林 雄一郎
  • 定価2,916円 (本体2,700円+税)
  • 判型A5
  • 226頁
  • ISBN978-4-274-22277-1
  • 発売日2018/10/06
  • 発行元オーム社

Rによるテキストマイニングを豊富な事例で解説!

 本書は、テキストマイニングの初心者に向けて活用事例を解説した入門書です。実務ですぐに応用したい人や、すでにほかの分析ツールを使っている方が参考にできる活用事例も豊富に掲載しています。
 また、実際のレポートや、データの収集からテキスト整形などの前処理、分析対象とする単語や品詞の頻度集計、分析対象に合わせた統計手法の選定、分析結果の可視化まで、分析プロジェクトにおける一連の流れを省略せずに解説しました。
 読者が実際にRによるテキストマイニングの分析ができるように最大限配慮しています。
目次

はじめに

Part I Rによるテキストマイニング

第1章 テキストマイニングの活用
1.1 テキストマイニングが活用される場面
1.2 テキストマイニングで活用されるデータ
1.3 テキストマイニングで活用される解析手法
1.4 テキストマイニングで活用される分析項目
1.5 テキストマイニングの分析レポート作成

第2章 Rの活用
2.1 Rの導入
2.2 基本操作
2.3 データハンドリング
2.4 可視化
2.5 テキスト処理

Part II 日本語テキストマイニングの活用事例

第3章 授業評価アンケートの分析
3.1 授業評価アンケートに基づく授業改善
3.2 分析データ
3.3 単純な頻度集計
3.4 品詞別の頻度集計
3.5 用例検索

第4章 オンラインレビューを用いたクチコミ分析
4.1 マーケティングのためのクチコミ分析
4.2 分析データ
4.3 レビューの評価の集計
4.4 低評価コメントと高評価コメントの比較
4.5 ワードクラウドによる可視化
4.6 共起語の集計
4.7 共起ネットワークによる可視化

第5章 スクレイピングによる特徴語抽出
5.1 スクレイピングによるテキストデータ収集
5.2 分析データ
5.3 特徴語抽出
5.4 用例検索

第6章 Twitterにおける話題と感情の抽出
6.1 ソーシャルデータ解析
6.2 ツイートを収集するための準備
6.3 分析データ
6.4 話題分析
6.5 感情分析

第7章 警察白書のトピック分析
7.1 白書から見る現代社会の諸相
7.2 分析データ
7.3 トピックモデル
7.4 階層型クラスター分析

第8章 文学作品の著者推定
8.1 文体識別指標を用いた著者推定
8.2 分析データ
8.3 箱ひげ図
8.4 教師なし学習
8.5 教師あり学習

Part III 英語テキストマイニングの活用事例

第9章 政治演説の言語分析
9.1 政治家の言語分析
9.2 分析データ
9.3 語彙多様性とリーダビリティ
9.4 高頻出語
9.5 感情分析

第10章 文学テキストの類型化
10.1 多変量解析を用いた文学研究
10.2 分析データ
10.3 高頻出語
10.4 テキスト分類

おわりに

ここでは、本書で使用したサンプルデータとコードを、圧縮ファイル(zip形式)で提供しています。Windowsユーザーの方はSJIS.zipを、Macユーザーの方はUTF8.zipをダウンロードしてください。
また、ファイルのご使用に際しましては、本書の執筆者 小林雄一郎先生のサポートサイト も併せてご覧ください。

  • 本ファイルは、本書をお買い求めになった方のみご利用いただけます。本書をよくお読みのうえ、ご利用ください。
  • 本ファイルの著作権については、株式会社オーム社および小林雄一郎氏に帰属します。
  • 本ファイルを利用したことによる直接あるいは間接的な損害に関して、著者およびオーム社はいっさいの責任を負いかねますので、あらかじめご了承ください。

関連書籍