多数据集多任务以自我为中心的动作识别 纸质多数据集多任务以自我为中心的动作的代码( ) 抽象的 对于以自我为中心的视觉任务(例如动作识别),标记数据相对缺乏。 这增加了训练期间过度拟合的风险。 在本文中,我们通过介绍一种在训练过程中采用相关任务以及相关数据集的多任务学习方案来解决此问题。 相关任务指示所执行的动作,例如对象的存在和手的位置。 通过将相关任务作为要优化的附加输出,动作识别性能通常会提高,因为网络专注于视频中的相关方面。 尽管如此,训练数据仍限于单个数据集,因为操作标签集通常在数据集中有所不同。 为了缓解此问题,我们扩展了多任务范例,以包括具有不同标签集的数据集。 在训练期间,我们有效地将批次与来自多个数据集的样本混合在一起。 我们在EPIC-Kits,EGTEA Gaze +,ADL和Charades-EGO数据集中进行的以自我为中心的动作识别实验证明了我们的方法相对于单个