融合多尺度特征及注意力機(jī)制的食品圖像識(shí)別
電子測(cè)量技術(shù)
頁(yè)數(shù): 8 2024-10-21
摘要: 針對(duì)食品圖像中類(lèi)間差異小、類(lèi)內(nèi)差異大以及結(jié)構(gòu)復(fù)雜導(dǎo)致識(shí)別難度大等問(wèn)題,提出了一種融合多尺度特征及注意力機(jī)制的食品圖像識(shí)別方法。首先,采用特征提取能力更強(qiáng)的ConvNeXt模型作為主干網(wǎng)絡(luò),以更好地捕捉食品圖像的細(xì)節(jié)特征;其次,引入改進(jìn)的ASPP模塊,擴(kuò)展感受野并利用多尺度信息,增強(qiáng)模型對(duì)不同尺度特征的捕捉能力;最后,在每個(gè)卷積塊后加入注意力機(jī)制,提高特征表達(dá)和上下文信息捕捉能力... (共8頁(yè))