貝葉斯學習
利用貝葉斯定理(Bayes' theorem)結合先驗概率與數據,獲得模型參數所呈現的概率分布的方法。人工智能的分支。
貝葉斯學習名稱來源于數學家T.貝葉斯。T.貝葉斯在1963年證明了一個關于貝葉斯定理的特例,后經多位統計學家的共同努力,貝葉斯學習在20世紀50年代之后逐步建立起來,成為機器學習領域的一個重要組成部分。此后,貝葉斯學習在后驗推理、參數估計、模型檢測、隱概率變量模型等諸多方面有廣泛的應用。利用貝葉斯定理進行近似求解,為機器學習算法的設計提供了一種有效途徑。
假定要估計的模型參數是服從一定分布的隨機變量,貝葉斯學習首先根據經驗給出待估參數的先驗分布;然后根據這些先驗信息,并與實際觀測的樣本信息相結合,利用貝葉斯定理求出待估參數的后驗分布;再參考損失函數,得出后驗分布的一些特征值,并把它們作為待估參數的估計度量來選取最優解。在所有的求解步驟中,貝葉斯方法使用概率的加和規則以及乘法規則對預測分布進行估計。因此,貝葉斯學習有較好的數據適應性和可擴展性,可用于機器學習的諸多問題:從單變量的分類與回歸到多變量的結構化輸出預測,從有監督學習到無監督及半監督學習等。
傳統貝葉斯方法囿于其推理速度較慢,因此在大數據背景下很難適應新的模型的要求。因此,如何進行大規模貝葉斯學習是學術界的重要挑戰之一。貝葉斯方法在大數據貝葉斯學習(big Bayesian learning,bigBayes)方面取得了顯著的理論與算法進展,包括隨機梯度及在線學習方法(對大規模數據集的多次隨機采樣在較短時間內得到較好結果)、分布式推理算法(部署分布式系統上的貝葉斯學習)、貝葉斯深度學習框架(貝葉斯神經網絡的所有參數都是分布,網絡的預測輸出也是分布)等。 隨著人工智能、機器學習技術研究的不斷深入,貝葉斯學習現已成為相關領域的一個熱點研究課題。除貝葉斯方法領域的專業性期刊或會議如貝葉斯分析(Bayesian Analysis)、應用貝葉斯統計國際會議(International Conference on Applied Bayesian Statistics)之外,貝葉斯學習方面的工作也廣泛出現在人工智能、機器學習領域的一流學術期刊或會議中。例如,2017年至2021年,人工智能與機器學習領域頂級會議國際人工智能聯合大會(IJCAI)、國際先進人工智能協會會議(AAAI)、國際機器學習會議(ICML)、國際計算機視覺與模式識別會議(CVPR),以及神經信息處理系統進展會議(NeurIPS)上發表的貝葉斯學習論文數逾50篇。