テキストデータの統計科学入門

Front Cover
岩波書店, 2009 - Data mining - 244 pages
ウェブや電子メールに代表されるように、テキストデータが大量に流通、蓄積されるようになった。文字列で記述されたデータの山から情報や知識を探し出すテキストマイニングの手法がさまざまな分野で必要になってきている。テキスト化された顧客の声から新たなニーズを抽出したり、迷惑メールを自動判別するなど、実用的な場面ですでに多くの活用がなされている。また、学術的な場面でも計量言語学やゲノム解析といった分野を中心に、強力な研究手段となっている。このように幅広い分野で共通に用いられる統計的テキストマイニングの知識とスキルを、フリーのソフトウェアと具体例を用いた実践で身につけるのが本書の目的である。統計的テキストデータ解析に焦点を絞り、初歩的な統計学の解説からはじめて、近年提案されたデータマイニング手法まで紹介している。そのおもな内容は文系・理系を問わず理解できるだろう。

What people are saying - Write a review

We haven't found any reviews in the usual places.

Bibliographic information