張穎芊副教授學(xué)術(shù)報告會
發(fā)布時間:2025-12-23   閱讀:1699

題目:深度強(qiáng)化學(xué)習(xí)在組合優(yōu)化問題中的應(yīng)用

時間:2025年12月23日 10:00-11:00

地點:機(jī)械與動力工程學(xué)院 F210會議室

邀請人:夏唐斌 教授(工業(yè)工程與管理系)


報告人簡介

1765878768471359.jpg

張穎芊,荷蘭埃因霍溫理工大學(xué)副教授,現(xiàn)任荷比盧人工智能協(xié)會主席、歐洲大數(shù)據(jù)價值協(xié)會技術(shù)專家委員會委員,主要研究方向涵蓋面向決策場景的深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)、可解釋且公平的人工智能技術(shù),并聚焦這些技術(shù)在物流、交通運輸及先進(jìn)制造系統(tǒng)中的應(yīng)用。


報告摘要

深度強(qiáng)化學(xué)習(xí)在組合優(yōu)化問題中的應(yīng)用,已成為人工智能與運籌學(xué)交叉領(lǐng)域的研究熱點。本次報告將介紹課題組近年來在該方向上的代表性工作,系統(tǒng)梳理面向組合優(yōu)化場景的深度強(qiáng)化學(xué)習(xí)方法體系:一是在線強(qiáng)化學(xué)習(xí),即智能體通過與代理環(huán)境實時交互,自主學(xué)習(xí)高效的決策策略;二是離線強(qiáng)化學(xué)習(xí),即智能體直接從固定數(shù)據(jù)集中訓(xùn)練策略,無需與環(huán)境交互;三是混合式方法,即利用強(qiáng)化學(xué)習(xí)動態(tài)引導(dǎo)局部搜索、遺傳算法等經(jīng)典啟發(fā)式算法的搜索過程。此外,報告還將簡要介紹若干強(qiáng)化學(xué)習(xí)在復(fù)雜現(xiàn)實決策場景中的成功應(yīng)用實踐項目。


腾冲县| 白山市| 连云港市| 东光县| 白银市| 仁怀市| 沂水县| 江陵县| 射洪县| 津市市| 平江县| 高平市| 贺兰县| 阿瓦提县| 九台市| 南京市| 隆德县| 民县| 甘泉县| 洛川县| 右玉县| 胶南市| 常山县| 玉龙| 鄂托克前旗| 桐梓县| 久治县| 湛江市| 新巴尔虎右旗| 绥化市| 琼海市| 行唐县| 宜春市| 恩施市| 徐州市| 遵化市| 德庆县| 罗甸县| 铜鼓县| 盐源县| 内黄县|