當(dāng)前位置:首頁 > 科技文檔 > 軟件 > 正文

基于強(qiáng)化學(xué)習(xí)的任務(wù)型對話策略研究綜述

計算機(jī)學(xué)報 頁數(shù): 31 2024-01-25
摘要: 對話系統(tǒng)在自然語言處理中發(fā)揮著重要作用,具有較好的實際應(yīng)用前景和許多值得研究的方向.對話策略是基于管道方法的人機(jī)對話系統(tǒng)的核心組件,能夠根據(jù)對話狀態(tài)生成響應(yīng)動作,進(jìn)而指導(dǎo)對話生成.對話策略學(xué)習(xí)常建模為(半)馬爾可夫決策過程,然后通過強(qiáng)化學(xué)習(xí)求解.近年來,基于強(qiáng)化學(xué)習(xí)算法解決任務(wù)型對話策略問題的研究層出不窮,而相關(guān)綜述缺乏.因此,本文對基于強(qiáng)化學(xué)習(xí)的任務(wù)型對話策略進(jìn)行分析、歸類、... (共31頁)

開通會員,享受整站包年服務(wù)立即開通 >
科技文檔