利用TensorFlow進行強化學習

NO IMAGE

編者注:您可以訪問 GitHub上的所有程式碼, 並在這裡檢視IPython Notebook 。 
更多人工智慧業務方面重要的發展請關注2018年4月10-13日人工智慧北京大會。

深入強化學習可能是一個難以掌握的領域。 在人們試圖學習如何解決強化學習問題時,很難在海量的縮略詞和機器學習模型間找到一個最好的著力點。強化學習理論並非新鮮事物,事實上,一部分強化學習的理論可以追溯到20世紀50年代中期。 如果你是強化學習領域徹頭徹尾的新手,我建議你查閱我以前的文章『關於強化學習和OpenAI Gym的介紹』,學習強化學習的基礎知識。

深度強化學習需要更新大量的梯度,深度學習工具(如TensorFlow)對於計算這些梯度非常有用。 深度強化學習也要求抽象地表示視覺狀態,在這種情況下,卷積神經網路效果最好。 在本文中我們將使用Python,TensorFlow和強化學習庫Gym來解決3D 遊戲Doom中的醫療包收集問題。 要獲取完整的程式碼和所需的依賴庫,請訪問本文的GitHub倉庫和Jupyter Notebook 。

以上僅為文章摘要,因本文中部分演示圖片過大,無法在此完整展示,如需閱讀更多精彩內容,請點選下方“閱讀原文”,訪問O’Reilly官網:https://www.oreilly.com.cn/ideas/


O’Reilly和Intel人工智慧2018北京大會正在火熱售票中……

報名AI Conference,

很簡單,識別圖中二維碼,

早鳥票等你入手!

640?wx_fmt=png