當前位置:首頁 > 科技文檔 > 自動化技術 > 正文

基于序列建模的生成式強化學習研究綜述

計算機科學 頁數: 16 2024-03-20
摘要: 強化學習是機器學習中關于如何學習決策的分支,是一個序列決策問題,通過與環(huán)境反復交互試錯找到最優(yōu)策略。強化學習可以與生成模型結合使用來優(yōu)化其性能,通常用于微調生成模型,提高其創(chuàng)建高質量內容的能力。強化學習過程也可以視為一個通用的序列建模問題,對任務軌跡上的分布進行建模,通過預訓練生成模型產生一系列動作來獲取一系列的高回報。在對輸入信息進行建模的基礎上,生成式強化學習能夠更好地處理... (共16頁)

開通會員,享受整站包年服務