基于文本摘要的無監(jiān)督關(guān)鍵詞抽取方法
計算機工程與設(shè)計
頁數(shù): 6 2024-09-16
摘要: 為克服基于嵌入的關(guān)鍵詞抽取方法在長文檔上性能下降的問題,提出一種基于文本摘要的方法(summarization-based document embedding rank, SDERank)。將句向量的加權(quán)和作為文檔嵌入,根據(jù)每個句子與文檔主題的語義相關(guān)度賦予權(quán)重。以往基于嵌入的方法選擇關(guān)鍵詞時忽略候選詞之間的關(guān)聯(lián),針對該問題,在SDERank的改進版SDERank+中,Pag... (共6頁)