图像字幕生成器(基线模型) Windows用户-使用cmd代替bash。 Windows虚拟机不支持在Tensorflow上进行GPU训练 数据集 Flickr8K数据集 Flickr8k_Dataset.zip() 包含8092个JPEG图像 1技嘉 Flickr8k_text.zip() 包含许多文件,这些文件包含照片的不同描述(标题)来源。 2.2兆字节 该数据集具有预定义的训练数据集(6,000张图像),开发数据集(1,000张图像)和测试数据集(1,000张图像)。 运行说明 1-文件夹设置 下载数据集文件并将其放置在github存储库中。 您的文件夹结构应如下所示: |-- data -- Flickr8k_Dataset -- Flickr8k_text |-- .gitignore |-- train.py |-- eval.py |-- pre