VSUA字幕:“用于对齐语言文字和视觉语义单元以进行图像字幕的代码”ACM MM 2019 源码
介绍 VSUA模型将图像表示为结构化图,其中的节点是所谓的视觉语义单位(VSU):对象,属性和关系单位。 我们的VSUA模型利用了字幕词和VSU之间的对齐方式。 引文 如果您发现此代码对您的研究有用,请引用 @inproceedings{guo2019vsua, title={Aligning Linguistic Words and Visual Semantic Units for Image Captioning}, author={Longteng Guo, Jing Liu, Jinhui Tang, Jiangwei Li, Wei Luo, and Hanqing Lu},
文件列表
VSUA-Captioning-master.zip
(预估有个25文件)
VSUA-Captioning-master
.gitmodules
183B
models
CaptionModel.py
9KB
__init__.py
348B
VSUAModel.py
22KB
misc
utils.py
4KB
__init__.py
0B
rewards_graph.py
3KB
暂无评论