利用tensorflow实现了一个经典的video caption模型hLSTMat,在msvd数据集上得到了与原论文类似的效果。