Visual7W图像数据是一个图像内容理解的数据集,通过对图像区域的文字描述和互相之间的关联,进行视觉问答(Visual Question Answering)任务,数据集中不仅包含图像本身,还包括图像内容的区域内容的问答。