機器學習及其在化學中的應用

《機器學習及其在化學中的應用》研究生/本科生課程

 

學分:2; 學時:32。 主講人:劉志榮 教授。

 

課程背景:

    機器學習是一門多領域交叉學科,它研究如何利用計算機從數據中進行學習,以獲取新的知識與技能,并提高自身的性能表現。機器學習在化學領域的應用具有悠久的曆史,例如,在上世紀60年代開發出的DENDRAL專家系統就是一個成功的例子,它能從質譜數據推斷出樣品中化學分子的組成。在另一方面,深度學習近10年來取得了巨大的發展,從而使機器學習與人工智能等學科獲得了革命性的突破,以AlphaGo等典型個例給人類社會帶來了巨大的震撼。現在,這種突破已經滲透到各個領域,包括化學:深度學習已經成功應用于有機合成分析(M. H. S. Segler et al., Planning chemical syntheses with deep neural networks and symbolic AI, Nature 555, 604 (2018))、蛋白質結構預測(2018年,AlphaFold在蛋白質結構預測比賽CASP中奪冠)。本課程将介紹機器學習的相關基礎知識,并分析機器學習在化學前沿領域的典型應用例子,以便更好地面對機器學習給化學學科所帶來的挑戰與機會。

 

基本目的:

    由深度學習的發展所推動的機器學習與人工智能領域在近幾年取得了迅猛的發展,對包括化學在内的諸多學科也開始産生影響。針對機器學習可能給化學學科所帶來的挑戰與機會,本課程将介紹機器學習的相關基礎知識,并分析機器學習在化學前沿領域的典型應用例子。通過課程的學習,希望能夠使學生達到如下目标:(1)掌握機器學習的基本知識;(2)能夠閱讀、分析與評估化學領域的機器學習文章;(3)能利用機器學習來解決簡單的問題。

 

參考書目:

1、Christopher M. Bishop, Pattern Recognition and Machine Learning. (Springer, 2006).

2、Richard S. Sutton and Andrew G. Barto, Reinforcement Learning: An Introduction. 2nd edition. (MIT Press, 2018).

3、Ian Goodfellow, Yoshua Bengio, and Aaron Courville, Deep Learning. (MIT Press, 2016). 中文譯本:伊恩.古德費洛(Ian Goodfellow)、約書亞.本吉奧(Yoshua Bengio)、亞倫.庫維爾(Aaron Courville) 著,趙申劍、黎彧君、符天凡、李凱 譯。深度學習。(人民郵電出版社,2017)。

4、Peter Harrington 著,李銳,李鵬,曲亞東 等 譯。機器學習實戰 [Machine learning in action]。(人民郵電出版社,2013)。

 

内容提要:

* 機器學習引言

* 線性回歸:最簡單的學習模型

* 分類的線性方法(簡單的線性法;邏輯回歸)

* 人工神經網絡

* 模型評估

* 核方法(高斯過程;支持向量機)

* 圖模型(樸素貝葉斯分類器;貝葉斯網絡;馬爾科夫随機場;玻爾茲曼機)

* 混合模型(K-均值法;混合高斯模型)

* 連續潛在變量(低維流形,PCA)

* 集成學習(Boosting;決策樹;随機森林?)

* 強化學習簡介,多臂老虎機

* 強化學習:有限馬爾科夫決策過程

* 強化學習的三種方法:動态規劃、蒙特卡羅、時序差分算法。

* 深度學習

* 化學例子:有機合成路線,AlphaFold,藥物設計,力場.