图像字幕生成 InceptionV3-多层GRU(Keras和TensorFlow) 要求: Python 3.6 TensorFlow 1.13.1(安装tensorflow-1.13.1-cp36-cp36m-win_amd64.whl) 凯拉斯2.2.4 Joblib 1.0.1 Matplotlib 3.3.4 Open CV 4.5.1 熊猫1.1.5 Nltk 3.5 下载Flickr30k或MSCOCO数据集图像和标题。 训练模型的步骤: 克隆存储库以保留目录结构。 对于Flickr30k放在flickr30k图像文件夹或MSCOCO results_20130124.token和Flickr30k图像放captions_val2014.json和MSCOCO图像COCO-images文件夹中。 通过运行以下python keras2tensorflo