Rによるやさしいテキストマイニング 機械学習編

Front Cover
株式会社 オーム社, Sep 15, 2017 - Computers - 256 pages

 

機械学習で捗るテキストマイニング! 機械学習を用いた本格的なテキストマイニングをやさしく解説! 

本書は、フリーの分析ツールであるRを用いて、機械学習による大規模なテキストデータ解析の手法などをわかりやすく解説した書籍です。

(1) ウェブからのテキストデータの自動収集、(2) 生の「きたない」データを分析しやすい「きれいな」データにするための前処理、(3) 大規模データを解析するための機械学習の手法、(4) 分析結果を顧客や上司に分かりやすく伝えるための可視化の手法を丁寧に解説しています。

解説は、数式が苦手な読者もすんなりと読めるように、手法の原理を直感的に理解できるイラスト・図面を多用した構成としています。


★このような方におすすめ・テキストマイニングや機械学習の技術を学びたいエンジニア ・テキストマイニングや機械学習に興味を持つ実務者 ・商用のテキストマイニングツールやクチコミ分析サービスの内部でどのような処理が行われているのかを知りたい人主要目次Part I テキストマイニング 第1章 自然言語処理 第2章 テキスト処理 第3章 スクレイピング Part II 機械学習 第4章 データハンドリング 第5章 教師あり学習―回帰 第6章 教師あり学習―分類 第7章 教師なし学習
 

What people are saying - Write a review

We haven't found any reviews in the usual places.

Contents

第1章自然言語処理
3
12 分析ツールの準備
4
13 形態素解析
8
14 構文解析
13
15 意味解析
16
16 言語判定
22
17 文書要約
24
第2章テキスト処理
27
48 データ形式の変換
103
49 パイプ演算子
106
第5章教師あり学習回帰
109
52 線形単回帰
111
53 線形重回帰
119
54 平滑化回帰
127
55 正則化回帰
132
第6章教師あり学習分類
137

22 テキストの整形
32
23 単語の頻度集計
35
24 ngramの頻度集計
41
25 共起語の頻度集計
46
26 用例検索
50
第3章スクレイピング
55
32 Wikipediaからのテキストデータ抽出
57
33 ブログからのテキストデータ抽出
62
34 Twitterからのテキストデータ抽出
64
35 オープンデータの活用
72
36 文字コードの確認と変更
75
Part II 機械学習
79
第4章データハンドリング
81
42 行と列の抽出
84
43 データの要約
89
44 列の操作
92
45 データの結合
94
46 データの並び替え
98
47 カテゴリーごとの集計
100
62 ナイーブベイズ
143
63 ニューラルネットワーク
146
64 サポートベクターマシン
152
65 決定木
158
66 バギング
163
67 ブースティング
167
68 ランダムフォレスト
174
第7章教師なし学習
183
72 非階層型クラスター分析
193
73 主成分分析
198
74 自己組織化マップ
204
75 word2vec
208
76 トピックモデル
214
読書案内
223
あとがき
226
参考文献
228
索引
234
奥付
243
Copyright

Common terms and phrases

Bibliographic information