ECE 695 CUDA编程第4部分(奖金) 蒂姆·罗杰斯教授TA:Abhishek Bhaumick 到期日为2021年5月8日 介绍 这部分的说明很简单:获取在​​前3个实验中创建的计算内核,并使用它们从中创建AlexNet。 提醒您,AlexNet [[1]]的体系结构如下。 尝试尽可能优化整个AlexNet流程-考虑到要花费多长时间,在CPU上对其进行验证将非常困难。 因此,只需测量不同批次大小的AlexNet的完整执行时间并报告即可。 完成此操作将给您带来可观的信誉,现在您可以声称自己使用CUDA从零开始实现了AlexNet :) 参考 Alex Krizhevsky,Ilya Sutskever和Geoffrey E. Hinton。 2012年。《具有深层卷积神经网络的ImageNet分类》。 在第25届神经信息处理系统国际会议论文集-第1卷(NIPS'12)中。 C