随着数据规模和计算资源的快速增长,机器学习在理论和实践两方面都取得了长足进展。传统机器学习方法通常依赖于数据的生成机制不随环境改变这一基本假设。然而在机器学习的各种应用领域中,如大数据分析、自然语言处理、计算机视觉、生物信息学等,上述假设往往因为过于严格而难以成立。如何分析和挖掘非平稳环境中的大规模数据是现代机器学习最具有挑战性的前沿方向之一。迁移学习放宽了传统机器学习中训练数据和测试数据必须服从独立同分布的约束,因而能够在彼此不同但又相互关联的两个领域间挖掘领域不变的本质特征和结构,使得标注数据等有监督信息可以在领域间实现迁移和复用。迁移学习是解决目标任务标注数据稀缺的基础方法,其研究仍处于富有挑战的阶段。本文面向跨领域非结构化数据的分类和预测任务,系统地研