程序員書庫(ID:OpenSourceTop)綜合整理
綜合自:https://space.bilibili.com/511221970?spm_id_from=333.788.b_765f7570696e666f.2、https://www.zhihu.com/people/zhou-bo-lei
上個月,香港中文大學(CUHK)信息工程系助理教授周博磊在知乎上表示自己有一個大膽的想法:每週把每節課用中文在B站上直播《強化學習》課程:
近日,經過一番內心掙扎的周博磊終於在B站上上傳了第一課。
這門課講了什麼?
該課程分為基礎部分和高階強化部分,基礎部分是由8個小節組成,每一節可能會有兩個課時左右,首先從強化學習的基礎開始。
第二部分是高階的課程內容,如圍棋AI AlphaGo、遊戲AI AlphaStar、OpenAI Five以及強化學習的分佈式構建、生成模型等。課程使用的編程語言是Python,深度學習框架則是PyTorch為主。
此外,周博磊老師還推薦讀者使用《深度學習》這本書,這本書的英文版是開源的,可以免費下載,《深度學習》下載地址:http://incompleteideas.net/book/the- book- 2nd.html
課程適合人群
這門課程面向大三大四以及研一的同學。你應該具備一些線性代數的背景知識,上過概率論、機器學習相關的一門課程(數據挖掘、模式識別、深度學習等)。有Python和PyTorch編程經驗。
第一節課部分PPT展示
第一課包含上下兩個部分,主要介紹強化學習的基本概念、序列決策入門、強化學習編程實踐等內容。部分PPT展示如下:
課程地址:https://space.bilibili.com/511221970?spm_id_from=333.788.b_765f7570696e666f.2
最後,課程的PPT和代碼都會上傳到Github上,需要的同學也可以前往下載。(Github地址:https://github.com/zhoubolei/introRL)
閱讀更多 程序員BUG 的文章