基于強(qiáng)化學(xué)習(xí)的人員輪休調(diào)度方法
摘要: 針對(duì)傳統(tǒng)調(diào)度方法求解效果差、效率低、輪休約束表達(dá)不準(zhǔn)確的問(wèn)題,首次提出一種基于強(qiáng)化學(xué)習(xí)的人員輪休調(diào)度方法。該方法將輪休調(diào)度過(guò)程構(gòu)建為Markov決策過(guò)程,利用動(dòng)作掩碼方法實(shí)現(xiàn)輪休約束,通過(guò)深度Q網(wǎng)絡(luò)(DQN)方法對(duì)輪休調(diào)度的策略進(jìn)行學(xué)習(xí)。最后,采用學(xué)習(xí)得到的調(diào)度策略對(duì)人員進(jìn)行快速安排。實(shí)驗(yàn)表明,在遵守輪休約束的前提下,該方法能夠快速給出匹配每日人力需求的人員安排。對(duì)比傳統(tǒng)的基于... (共12頁(yè))
開通會(huì)員,享受整站包年服務(wù)