Automated_Image_Captioning:使用深度学习和Flickr 8k数据集进行自动图像字幕。 还比较了Xception模型和Inception
Torrent_to_Drive 使用深度学习和Flickr-8k数据集进行自动图像字幕。 还对Xception模型和Inception模型进行了比较。 这是使用卷积神经网络和一种递归神经网络(LSTM)为所有类型的图像生成标题和替代文本的最简单方法。 关于 图像特征将从在imagenet数据集上训练的CNN模型中提取(请参见下文),然后将特征输入到LSTM模型中,后者将负责生成图像标题。 此回购围绕Keras提供的2个模型进行。 提取的功能可以在找到 使用的数据集可以在找到 Jupyter笔记本可以在找到 训练过的模型可以在找到 需求和依赖关系可以在找到 字幕生成器可以在找到 想要贡献? 建议,错误报告,错误解决受到高度赞赏,请打开问题和/或PR 建立 设置虚拟环境(强烈推荐) 激活环境。 安装需求,使用pip3 install -r requirements.txt 注意:
文件列表
Automated_Image_Captioning-master.zip
(预估有个16文件)
Automated_Image_Captioning-master
.gitignore
12KB
README.md
2KB
Features
README.md
858B
Dataset
README.md
623B
caption_generator_Inception.py
16KB
Notebook
caption_generator_Xception.ipynb
147KB
暂无评论