基于大語言模型的中文科技文獻標注方法
計算機工程
頁數(shù): 8 2024-01-19
摘要: 高質(zhì)量的標注數(shù)據(jù)是中文科技文獻領(lǐng)域自然語言處理任務(wù)的重要基石。針對目前缺乏中文科技文獻的高質(zhì)量標注語料以及人工標注質(zhì)量參差不齊且效率低下的問題,提出一種基于大語言模型的中文科技文獻標注方法。首先,制定適用于多領(lǐng)域中文科技文獻的細粒度標注規(guī)范,明確標注實體類型以及標注粒度;其次,設(shè)計結(jié)構(gòu)化文本標注提示模板和生成解析器,將中文科技文獻標注任務(wù)設(shè)置成單階段單輪問答過程,將標注規(guī)范和帶... (共8頁)