主講人:崔澤 上海大學(xué)副教授
時(shí)間:2024年5月20日13:30
地點(diǎn):二教439室
舉辦單位:數(shù)理學(xué)院
主講人介紹:崔澤,博士,上海大學(xué)機(jī)電工程與自動(dòng)化學(xué)院副教授,碩士生導(dǎo)師。長(zhǎng)期從事智能裝備研發(fā)、工業(yè)機(jī)器人應(yīng)用等領(lǐng)域。發(fā)表論文20余篇,授權(quán)發(fā)明專(zhuān)利20余項(xiàng)。
內(nèi)容介紹:對(duì)機(jī)械臂自學(xué)習(xí)相關(guān)問(wèn)題進(jìn)行闡述,針對(duì)兩個(gè)主要問(wèn)題開(kāi)展研究,第一個(gè)問(wèn)題:如何縮短智能體(策略網(wǎng)絡(luò))在虛擬環(huán)境中學(xué)習(xí)任務(wù)的訓(xùn)練收斂時(shí)間。在處理復(fù)雜任務(wù)時(shí),使用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練可能需要大量時(shí)間來(lái)使模型收斂;第二個(gè)問(wèn)題 :如何將虛擬環(huán)境中訓(xùn)練好的智能體遷移到真實(shí)環(huán)境中,從而縮短智能體在真實(shí)環(huán)境中的訓(xùn)練時(shí)間,最后結(jié)合演示學(xué)習(xí),實(shí)現(xiàn)機(jī)械臂自主抓取以及開(kāi)門(mén)等操作。



