計(jì)算機(jī)視覺(jué)研究中, 目標(biāo)檢測(cè) 是一個(gè)比分類(lèi)更困難的領(lǐng)域,我們將回顧它的歷史和最近的發(fā)展。 在深度學(xué)習(xí)時(shí)代之前,像 HOG 和特征金字塔這樣的手工特性被廣泛用于獲取圖像中的定位信號(hào)。 然而,這些方法通常不能很好地?cái)U(kuò)展到通用的目標(biāo)檢測(cè),所以大多數(shù)的應(yīng)用僅限于 人臉識(shí)別 或者行人檢測(cè)。
一共搜集了65篇2D目標(biāo)檢測(cè)論文,涉及:通用目標(biāo)檢測(cè)、旋轉(zhuǎn)目標(biāo)檢測(cè)、Few-shot/自監(jiān)督/半監(jiān)督/無(wú)監(jiān)督目標(biāo)檢測(cè)等方向。 最新! CVPR 2021 視覺(jué)Transformer論文大盤(pán)點(diǎn)(43篇)
由于低分辨率低,像素有限,小目標(biāo)檢測(cè)很困難。 例如,通過(guò)只看下圖上的目標(biāo),人類(lèi)甚至很難識(shí)別這些物體。 然而,通過(guò)考慮到它位于天空中的背景,這個(gè)物體可以被識(shí)別為鳥(niǎo)類(lèi)。 因此,我們認(rèn)為,解決這個(gè)問(wèn)題的關(guān)鍵取決于我們?nèi)绾螌⑸舷挛淖鳛轭~外信息來(lái)幫助檢測(cè)小目標(biāo)。
有研究員提出了一種利用上下文的目標(biāo)檢測(cè)方法來(lái)提高檢測(cè)小目標(biāo)的精度。 該方法通過(guò)連接多尺度特征,使用了來(lái)自不同層的附加特征作為上下文。 研究員還提出了具有注意機(jī)制的目標(biāo)檢測(cè),它可以關(guān)注圖像中的目標(biāo),并可以包括來(lái)自目標(biāo)層的上下文信息。 實(shí)驗(yàn)結(jié)果表明,該方法在檢測(cè)小目標(biāo)方面的精度高于傳統(tǒng)的SSD框架。 下圖顯示了SSD框架無(wú)法檢測(cè)到小目標(biāo)時(shí)的案例情況。