Domain adaptation,DA,中文可翻译为域适配、域匹配、域适应,是迁移学习中的一类非常重要的问题,也是一个持续的研究热点。Domain adaptation可用于计算机视觉、物体识别、文本分类、声音识别等常见应用中。这个问题的基本定义是,假设源域和目标域的类别空间一样,特征空间也一样,但是数据的分布不一样,如何利用有标定的源域数据,来学习目标域数据的标定?
事实上,根据目标域中是否有少量的标定可用,可以将domain adaptation大致分为无监督(目标域中完全无label)和半监督(目标域中有少量label)两大类。我们这里偏重介绍无监督。
关于迁移学习的理论方面,有三篇连贯式的理论分析文章连续发表在NIPS和Machine Learning上:理论分析
求:的标定 (在实验环境中,是有标定的,仅用来测试算法精度)
条件:
比如说,同样都是一台电脑,在不同角度,不同光照,以及不同背景下拍照,图像的数据具有不同的分布,但是从根本上来说,都是一台电脑的图像。Domain adaptation要做的就是,如何根据这些不同分布的数据,很好地学习缺失的标定。
Domain adaptation可以算是迁移学习领域最火的研究点了。因此,试图来解决此问题的方法层出不穷。从早期的基于实例的迁移、基于模型的迁移,到偏重数学变换的基于特征的迁移,再到如今的深度迁移,诞生了许多经典的DA方法。我们不打算面面俱到,也没有必要。在这里仅列出最经典的那些方法(何为最经典?引用量大且发表会议/刊物级别高),并在之后单独写文章深入介绍每个方法。时间有限,并且为了保证质量,不可能一次做完。
代表性的方法及文章:
-
迁移成分分析方法(Transfer component analysis, TCA)
- Domain adaptation via tranfer component analysis
- 发表在IEEE Trans. Neural Network期刊上(现改名为IEEE trans. Neural Network and Learning System),前作会议文章发在AAAI-09上
- 我的解读
-
联合分布适配方法(joint distribution adaptation,JDA)
- Transfer Feature Learning with Joint Distribution Adaptation
- 发表在2013年的ICCV上
- 我的解读
-
测地线流式核方法(Geodesic flow kernel, GFK)
-
领域不变性迁移核学习(Transfer Kernel Learning, TKL)
- Domain invariant transfer kernel learning
- 发表在IEEE Trans. Knowledge and Data Engineering期刊上
-
深度适配网络(Deep Adaptation Network, DAN)
- 发表在ICML-15上:learning transferable features with deep adaptation networks
- 我的解读
接下来会继续添加方法,以及开始对每种方法的细致说明