生成对抗网络(GANs)在过去的几年里得到了广泛的研究。可以说,它们最重要的影响是在计算机视觉领域,在这一领域中,图像生成、图像-图像转换、面部属性处理和类似领域的挑战取得了巨大进展。
机器学习在许多部署的决策系统中发挥着作用,其方式通常是人类利益相关者难以理解或不可能理解的。以一种人类可以理解的方式解释机器学习模型的输入和输出之间的关系,对于开发可信的基于机器学习的系统是至关重要的
GAN逆转化的目的是将给定的图像逆映射到预先训练好的GAN模型的潜在空间,以便由生成器从反代码忠实地重建图像。
本文提供了针对视觉识别的单类别分类OCC的经典统计和基于深度学习的最新方法的全面调研。详细并讨论了现有OCC方法的优缺点,还介绍了OCC的常用数据集和评估指标。单类别分类(One-Class Clas
时尚是我们向世界展示自己的方式,已经成为世界上最大的产业之一。时尚主要通过视觉来传达,因此近年来受到了计算机视觉研究者的广泛关注。
对自然图像中的文本进行检测和识别是计算机视觉领域的两个主要问题,在体育视频分析、自动驾驶、工业自动化等领域都有广泛的应用。他们面临着共同的具有挑战性的问题,即文本如何表示和受几种环境条件的影响的因素。
少样本学习(FSL)在机器学习领域具有重要意义和挑战性。成功地从很少的样本中学习和归纳的能力是区分人工智能和人类智能的一个明显的界限,因为人类可以很容易地从一个或几个例子中建立他们对新颖性的认知,而机
随着自动驾驶和机器人技术等实际应用的发展,人们越来越关注对3D点云的理解。虽然深度学习在基于图像的任务上取得了显著的成功,但深度神经网络在处理大量、非结构化和噪声的三维点时仍面临着许多独特的挑战。
为机器配备对世界实体及其关系的全面了解一直是人工智能的一个长期目标。在过去的十年中,大规模知识库(也称为知识图谱)已经从Web内容和文本源中自动构建出来,并且已经成为搜索引擎的关键模块。
人群估计在实际应用中有着重要的意义,如人群分析和视频监控中,人群计数对于构建更高层次的认知能力至关重要。近来,北航的学者发布了关于基于CNN的人群计数综述论文,调研了220+工作,对人群计数模型进行了