显示,出席和讲述 更新(2016年12月2日)的TensorFlow实现其中引入了基于注意力的图像字幕生成器。 在生成每个单词时,模型将注意力转移到图像的相关部分。 参考文献 作者的theano代码: : 另一个tensorflow实现: : 入门 先决条件 首先,将此和克隆到同一目录中。 $ git clone https://github.com/yunjey/show-attend-and-tell-tensorflow.git $ git clone https://github.com/tylin/coco-caption.git 这段代码是用Python2.7编写的,