为提高协同过滤算法的可伸缩性,加快其运行速度,提出了一种基于GPU(graphicprocessingunit)的并行协同过滤算法来实现高速并行处理。GPU的运算模式采用单指令多数据流,适用于逻辑性弱、数据量巨大的运算,而这正是协同过滤算法所具有的特点。使用统一计算设备框架(computeunifieddevicearchitecture,CUDA)实现了此协同过滤算法。实验表明,在中低端的GPU上该算法与在高端的四核CPU上的协同过滤算法相比,其加速比达到40倍以上,显著地提高了算法的可伸缩性,而算法在准确率方面也有优秀的表现。