化学のための Pythonによるデータ解析・機械学習入門

Front Cover
株式会社 オーム社, Oct 21, 2019 - Science - 240 pages

化学・化学工学分野でPythonを使って機械学習を行うための入門書

本書は、化学・化学工学分野でPythonを使って機械学習を行うための入門書です。

これまでに蓄積してきた実験/製造データをデータ解析・機械学習を用いて分析することで、いままでとはまったく別のアプローチで材料開発を加速させたり、プロセス管理を効率化・安定化させたりすることができます。なぜなら、実験や製造データは、目に見えない、研究者・技術者の知識・知見・経験・勘の宝庫だからです。そして、データ解析・機械学習を用いることで、これらを目に見える形にすることができるからです。

読者が一から実践できるよう、Pythonのインストール方法、データ解析・機械学習の基本理論から、材料設計、分子設計、プロセス管理について実際にサンプルプログラムとサンプルデータセットを使った実践までを丁寧に解説しています。


第1部 Pythonと統計の基礎知識

   1章 Pythonの基礎

      1.1 Python の使い方

      1.2 データセットの読み込み・保存

   2章 データの図示

      2.1 ヒストグラム

      2.2 箱ひげ図

      2.3 散布図

      2.4 相関行列

第2部 データ解析・機械学習の基礎

   3章 多変量データとデータの可視化

      3.1 多変量データ

      3.2 データの前処理

      3.3 主成分分析

      3.4 階層的クラスタリング

      3.5 非線形の可視化手法

   4章 化学データを用いたモデリング

      4.1 回帰分析

      4.2 クラス分類

   5章 回帰モデル・クラス分類モデルの適用範囲

      5.1 モデルの適用範囲とは?

      5.2 データ密度

      5.3 アンサンブル学習法

第3部 化学・化学工学データでの実践のしかた

   6章 材料設計・分子設計・医薬品設計

      6.1 材料設計

      6.2 分子設計・医薬品設計

      6.3 化学構造の表現方法

      6.4 化合物群の扱い

      6.5 化学構造の数値化

      6.6 化学構造の生成

      6.7 化合物のデータセットを扱うときの注意点

      6.8 具体的なデータセットを用いた解析

   7章 時系列データの解析

      7.1 化学プラントにおける推定制御・ソフトセンサー

      7.2 時系列データ解析の特徴

      7.3 モデルの劣化と適応型ソフトセンサー

      7.4 データ解析・機械学習による化学プラントのプロセス管理(異常検出・異常診断)

 

Contents

第1部 Pythonと統計の基礎知識
1
第1章 Pythonの基礎
3
12 データセットの読み込み保存
7
第2章データの図示
11
22 箱ひげ図
13
23 散布図
15
24 相関行列
17
第2部データ解析機械学習の基礎
19
第3部化学化学工学データでの実践のしかた
109
第6章材料設計分子設計医薬品設計
111
611 樹脂材料高分子材料
112
612 超伝導体材料
117
613 ベイズ最適化Bayesian Optimization
125
62 分子設計医薬品設計
126
63 化学構造の表現方法
128
631 Simplified Molecular Input Line Entry SystemSMILES
129

第3章多変量データとデータの可視化
21
PCA
24
34 階層的クラスタリング
36
tdistributed Stochastic Neighbor EmbeddingtSNE
41
第4章化学データを用いたモデリング
45
411 最小二乗法による線形単回帰分析
46
412 最小二乗法による線形重回帰分析
51
413 回帰モデルの推定性能の評価
55
414 オーバーフィッティングoverfitting多重共線性multicollinearity
58
PCR
59
CVハイパーパラメータhyperparameter
60
PLS
62
418 非線形の回帰分析
67
SVR
68
42 クラス分類classification
77
kNN
78
422 クラス分類モデルの推定性能の評価
80
SVM
83
DT
89
RF
92
第5章回帰モデルクラス分類モデルの適用範囲
95
52 データ密度
98
522 OneClass Support Vector MachineOCSVM
99
53 アンサンブル学習法Ensemble learning
106
632 MOL file
130
64 化合物群の扱い
132
65 化学構造の数値化
133
66 化学構造の生成
134
67 化合物のデータセットを扱うときの注意点
137
68 具体的なデータセットを用いた解析
138
681 沸点
143
682 環境毒性クラス分類
148
683 薬理活性回帰分析
152
684 薬理活性クラス分類
157
685 融点
161
686 水溶解度
166
第7章時系列データの解析
173
72 時系列データ解析の特徴
183
73 モデルの劣化と適応型ソフトセンサーAdaptive Soft Sensor
185
731 蒸留塔における適応型ソフトセンサーの検討
190
732 排煙脱硝装置における適応型ソフトセンサーの検討
193
74 データ解析機械学習による化学プラントのプロセス管理異常検出異常診断
196
741 異常検出モデルの構築および検証
199
742 異常に関係するプロセス変数の診断
202
参考文献
205
索引
208
奥付
213
Copyright

Other editions - View all

Common terms and phrases

Bibliographic information