適合年級 (Grade): 大學生及以上
適合專業 (Major): 計算機科學、人工智能、數據科學、電子與計算機工程等專業,軟件工程、自動化等相關專業或者希望掌握強化學習的學生;對人工智能、大數據以及交叉學科和方向感興趣的學生;
學生需要具備線性代數及概率論與數理統計基礎,至少會使用一門編程語言實現神經網絡,有過強化學習開發經驗的申請者優先
項目內容涉及強化學習核心理論和技能,具體包括遺傳算法、強化學習框架、Q-learning、行動者-批評(actor-critic;AC)模型、馬爾可夫決策過程、優化控制、圖神經網絡(graph neural networks; GNN)、自動機器學習(Auto ML)等。學生通過項目了解如何開發基于強化學習的生產力軟件,在結束時提交項目個性化研究課題報告,進行成果展示。
?Pietro導師現任劍橋大學計算機科學與技術終身正教授,意大利國家認定Top100科學家, H-index64,被引用次數35000+。
?教授2021年連中三篇計算機頂會ICML,其論文還曾發表在包括世界級學術期刊 《Nature》。
?導師持有歐洲學習和智能系統實驗室(Ellis;歐洲大型跨國人工智能研究所,目前擁有千位全球頂尖計算機工程師、數學家和其他領域科學家,旨在重構歐洲人工智能前沿研究)席位、劍橋大學大數據研究指導委員會席位。
?Pietro導師的研究興趣為人工智能圖神經網絡建模,在國際知名學術期刊發表論文多篇,曾榮獲歐盟委員會未來與新興技術(FET;迄今歐盟規模最大、資助力度最強的科研資助項目之一)會展三等獎。
7周在線小組科研學習+5周論文指導學習,共125課時
項目報告
優秀學員獲得主導師 Reference Letter
結業證書
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級別索引國際會議全文投遞與發表指導
成績單
強化學習在博弈論中的應用:類alpha算法開發
利用經驗留存解決強化學習所需樣本太多問題的可行性分析
強化學習中的機器獎勵設置方法迭代
為強化學習過擬合的特定場景重新建模的自動過程研究
具有精確尺度估計的動作-評價網絡結構與強化學習優勢函數
開課日期:2023-04-29
具體上課時間、最終時間安排,均以實際安排為準
幾何留學APP
2403個學校
10299個專業
3117個錄取案例
8697份錄取報告