物件偵測的領域自適應 (Domain Adaptation)

6 min readJun 24, 2022

Background

領域自適應 (Domain Adaptation) 是遷移學習中很重要的一部分內容，目的是把不同分佈的 Source data 和 Target data 映射到一個特徵空間，使得同類別的資料在該空間中儘可能接近，不同類別的資料在該空間中儘可能分開，如圖一所示：

實務上我們會有大量在 source domain 上的 synthetic data 的 label，而 Target domain 的 real data 則只有少量的 label，甚至是沒有 label，如圖二所示。

因此我們可以在 Source domain 中訓練一個模型並且在 Source domain 上有不錯的表現，而我們期望在分佈同化後，能夠在 Target domain 上有不錯的表現。

Classification

Deep Domain Confusion [1]

這個模型架構 (圖三) 的左邊的輸入是本身有 label 的 source domain data，而右邊的輸入則是本身沒有 label 的 target domain data，它們兩個輸入都會經過一個共享的網路，進而得到各自的低維度 feature：fc_adapt，其中有 label 的 fc_adapt 則可以用來訓練 classification loss，而 source domain 和 target domain 的低維度 feature 則可以用來訓練 domain loss，

而 domain loss 則用 Maximum Mean Discrepancy (MMD) 這個度量方法來計算，目的是為了減小兩個 DNN 學到的 feature 之間的距離，進而減少 source 和 target 之間的分佈差距。

最終的目標函數就是 classification loss 和 domain loss (MMD) 的加權損失：

2. Domain-Adversarial Training of Neural Networks (DANN) [2]

使用 Adversarial learning (gradient reversal layer) 來讓兩個 domain 間的分類分的不好，進而讓 source 和 target 的分佈儘可能接近。

圖四、Domain-Adversarial Training of Neural Networks

Object Detection

Cross-Domain Adaptive Teacher for Object Detection [3]

這個方法是比較新的方法 (2022)，也有用到 Adversarial learning 來讓兩個分佈儘可能接近。主要是使用 two-stage 的模型來訓練，訓練步驟如下：

使用有 label 的 source data 訓練一個 teacher model (綠底)
使用 teacher model 預測經過 weak augmentation (調亮暗顏色等)的 target data 進而得到 pseudo-label
使用 student model (藍底) 訓練經過 strong augmentation (隨機裁切、翻轉等) 後的 source (有實際 label) 和 target (使用 pseudo-label)
使用 discriminator 讓模型分不出 source 和 target 的差異，進而讓兩個 domain 間的分佈儘可能接近
使用 Exponentially Moving Average (EMA) 讓 teacher 和 student 進行權重融合進而獲得最終的模型

整個模型訓練架構圖如圖五所示：

圖五、Cross-Domain Adaptive Teacher for Object Detection

有關 Domain Adaptation 的其他教學可以參考李宏毅老師和課程助教在 youtube 上的影片

【機器學習2021】概述領域自適應 (Domain Adaptation)
[TA 補充課] More about Domain Adaptation (1/2) (由助教趙崇皓同學講授)
[TA 補充課] More about Domain Adaptation (2/2) (由助教楊晟甫同學講授)

Reference

[1] Unsupervised Domain Adaptation of Object Detectors: A Survey (Oza et al., 2021) [Paper]
[2] Deep Domain Confusion: Maximizing for Domain Invariance (Eric et al., 2014)[Paper]
[3] Domain-Adversarial Training of Neural Networks (Yaroslav et al., 2015) [Paper]
[4] Cross-Domain Adaptive Teacher for Object Detection (Yu-Jhe et al., 2022) [Paper] [Code]

物件偵測的領域自適應 (Domain Adaptation)

Background

Classification

Object Detection

Reference

Written by 張家銘