视觉问题回答项目,具有最先进的单一模型性能