变形的ViT 将可变形的多头注意力应用于ViT架构 待办事项清单: 完成日志记录代码和wandb日志记录 实施timm版本(用于224x224 16补丁尺寸图像的执行器和变压器) 代码和测试变形注意 变压器 演员 编码和测试本地感知的初始化 变压器 演员 编码和测试DeBERTa注意 变压器 演员 用法 结果 用法 链接 (可变形的多尺度注意) cp pc注意) (可识别位置的初始化) (执行器tensorflow实现) 库) 日志记录)