Softmax

1/2ページ

吳恩達《深度學習-改善深層神經網路》3–超引數除錯、正則化以及優化

1. 系統組織超參除錯Tuning process 1)深度神經網路的超參有學習速率、層數、隱藏層單元數、mini-batch大小、學習速率衰減、β(優化演算法)等。 其重要性各不相同,按重要性分類的話:    第一類:最重要的引數就是學習速率α     第二類:隱藏層單元數、mini-batch大 […]