光華講壇——社會(huì)名流與企業(yè)家論壇第6832期
主題:隨機(jī)控制問(wèn)題的連續(xù)策略與價(jià)值迭代及其收斂性
主講人:美國(guó)伍斯特理工學(xué)院數(shù)學(xué)科學(xué)系 汪谷副教授
主持人:數(shù)學(xué)學(xué)院院長(zhǎng) 馬敬堂教授
時(shí)間:11月26日16:00-17:00
地點(diǎn):柳林校區(qū)通博樓B412
主辦單位:數(shù)學(xué)學(xué)院 科研處
主講人簡(jiǎn)介:
汪谷,美國(guó)伍斯特理工學(xué)院數(shù)學(xué)科學(xué)系副教授,研究方向?yàn)殡S機(jī)控制及其在金融領(lǐng)域的應(yīng)用。于2007年在北京大學(xué)取得數(shù)學(xué)與應(yīng)用數(shù)學(xué)學(xué)士學(xué)位,2013年在波士頓大學(xué)取得數(shù)學(xué)博士學(xué)位。在2013年至2015年間,擔(dān)任密歇根大學(xué)博士后助理教授。
內(nèi)容提要:
本講座將介紹一種連續(xù)策略-價(jià)值迭代方法,該方法通過(guò)朗之萬(wàn)類(lèi)型的動(dòng)力學(xué)同時(shí)更新隨機(jī)控制問(wèn)題的價(jià)值函數(shù)近似值和最優(yōu)控制策略。該框架適用于無(wú)限時(shí)間尺度的熵正則化松弛控制問(wèn)題以及經(jīng)典控制問(wèn)題。