近日,伟德官网地址信息與計算機工程學院郭繼峰老師團隊在中科院一區Top(升級版)期刊IEEE Transactions on Circuits and Systems for Video Technology(JCR Q1,CCF-B,IF=4.685)上在線發表了題為“Median stable clustering and global distance classification for cross-domain person re-identification”的研究論文。
該研究提出的優化方法與經典基于triplet loss的跨域行人重識别(ReID)方法存在本質區别,利用距離分類器在全局範圍内對正負樣本對的距離進行優化,且能夠充分利用聚類信息。最終模型性能超越了目前大多數的主流方法。
在聚類過程中,為減小攝像機差異帶來的影響,在計算兩個樣本的特征距離時加入了攝像機懲罰因子;為進一步降低離群點的影響,為每對樣本距離賦予不同的權重;為使簇内樣本數相對均勻,提出一種基于假設質心的樣本數正則項。最終聚類結果中的錯誤僞标簽的數量顯著減少。
(a) Clustering results of HCT |
(b) Clustering results of MSC |
圖 1:對Market-1501中的部分聚類結果進行T-SNE可視化
此外,為彌補triplet loss的不足,該研究提出一種基于距離分類器的全局距離分類方法。不同于以往為任務設計特定優化函數的思想,該研究使用可訓練的神經網絡作為優化目标,即将特征提取器将距離分類器的準确度當作優化目标。該方法能夠有效減少正負樣本對的距離分布之間的重合。為ReID的技術發展與理論探索提供新的思路。
(a) HCT on Market-1501 |
(b) GDC on Market-1501 |
(c) HCT on DukeMTMC-reID |
(d) GDC on DukeMTMC-reID |
圖2: 在兩個目标數據集的測試集上的正樣本對(藍色)和負樣本對(紅色)的距離直方圖
信息與計算機工程學院19級計算機科學與技術碩士研究生龐志奇為論文第一作者,導師郭繼峰高級實驗師為論文通訊作者。該研究得到黑龍江省自然科學基金和中央高校基礎科研項目的資助。
論文下載網址:https://ieeexplore.ieee.org/document/9509511