本文へスキップします。

【参】モーダルJS:読み込み
書籍DB:詳細

Pythonによるテキストマイニング入門

Python 3を使ったテキストマイニングの入門書!

本書は、Pythonを使ったテキストマイニングの入門書です。Pythonのインストールから基本文法、ライブラリパッケージの使用方法などについてもていねいに解説していますので、Pythonに触れたことがない方でも問題なく使用できます。また、テキストマイニングも、概要から実例に至るまで一から解説していますので、Python・テキストマイニング両方の知識が全くない方にとって最適な入門書となっています。
第1章 テキストマイニングの概要
 1.1 テキストマイニングとは
 1.2 応用の例

第2章 テキストデータの構造
 2.1 テキストの構成要素
 2.2 統計分析・データマイニングの基本的な手法
 2.3 テキストマイニング固有の考え方

第3章 Python の概要と実験の準備
 3.1 Python とは
 3.2 プログラムを作って動かす環境
 3.3 Pyrhon の書き方ルール
 3.4 テキストマイニングに役立つライブラリパッケージ
 3.5 データの準備

第4章 出現頻度の統計の実際
 4.1 文字単位の出現頻度の分析
 4.2 単語の出現頻度の分析

第5章 テキストマイニングの様々な処理例
 5.1 連なり・N-gram の分析と利用
 5.2 共起(コロケーション)の分析と利用
 5.3 語の重要性とTF-IDF 分析
 5.4 KWIC による検索
 5.5 単語のプロパティを使ったネガポジ分析
 5.6 WordNet による類語検索
 5.7 構文解析と係り受け解析の実際
 5.8 潜在的意味論に基づく意味の分析とword2vec

付録 Python, Jupyter notebook のインストール

ここでは、本書内で使用しているコードを、圧縮ファイル(zip形式)にて提供しています(Python_code.zip;約50KB)。圧縮ファイルを解凍(フォルダ付き)してご利用ください。 なお、本コードは文字コードUTF-8で提供しております。
Windowsの場合、表示はUTF-8に対応したテキストエディタをご利用ください。
Windows上のPython3での実行は、UTF-8で正しく行われます。

  • 本ファイルは、本書をお買い求めになった方のみご利用いただけます。本書をよくお読みのうえ、ご利用ください。本ファイルの著作権は、本書の著者である山内長承氏に帰属します。
  • 本ファイルを利用したことによる直接あるいは間接的な損害に関して、編者およびオーム社はいっさいの責任を負いかねます。利用は利用者個人の責任において行ってください。

関連書籍