A Statistical View of Deep Learning Part 2
深度學習的統(tǒng)計學視角 Part 2
https://www.stat.colostate.edu/~jah/talks_public_html/isec2020/DeepLearningPart2.pdf
![]()
![]()
神經網(wǎng)絡作為統(tǒng)計模型
目標:提取輸入變量的線性組合作為衍生特征,再將目標變量建模為這些特征的非線性函數(shù)。
轉換為統(tǒng)計學術語:
- 我對響應變量與預測變量擬合一個非線性模型;
- 預測變量通過多元統(tǒng)計技術進行變換;
- 神經網(wǎng)絡即是一種非線性模型。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
深度學習:模型擬合
深度學習軟件
? Python
- 深度學習最流行的語言
- 面向對象的高級編程語言
- 主要包:TensorFlow、PyTorch、Keras 等
- 你需要學習 Python 嗎?也許吧
? Keras
- 用 Python 編寫的開源神經網(wǎng)絡庫。
- Keras 包是一個 API。
- API(應用程序編程接口)允許多個軟件包相互交互。
- Keras 可與以下工具交互: TensorFlow、Microsoft Cognitive Toolkit、R、Theano、PlaidML
———
A Statistical View of Deep Learning Part 2 | Jennifer Hoeting, Colorado State University 228 / 276
深度學習在 R 中
Caret 包中的神經網(wǎng)絡模型
- 神經網(wǎng)絡模型:nnet、mxnet、mxnetAdam、neuralnet 等
- 堆疊自編碼器深度神經網(wǎng)絡
- 其他多種選項
R 包:keras 和 kerasR ? 用于連接 Python 深度學習包 Keras 的接口 ? RStudio 的 Keras 頁面 ? 當其訪問的任一包更新時,可能會出現(xiàn) Bug
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
深度學習:
模型擬合的實踐
《深度學習的統(tǒng)計學視角》第二部分|Jennifer Hoeting,科羅拉多州立大學 249 / 276
模型擬合的實踐
訓練深度學習模型需要做出諸多決策,包括選擇:
- 模型架構(Model architecture)
- 損失函數(shù)(Loss function)
- 優(yōu)化方法(Optimization method)
- 上述各項的具體實現(xiàn)細節(jié)
模型擬合的實踐
需調整的部分深度學習參數(shù):
- 隱藏層層數(shù)與每層神經元數(shù)量
- 正則化(Regularization)
- 訓練輪數(shù)(Epochs)與批大小(Batch Size)
- 通用實踐建議
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
原文:https://www.stat.colostate.edu/~jah/talks_public_html/isec2020/DeepLearningPart2.pdf
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.