随着互联网的快速发展,计算机安全问题已经提高到国家安全的战略角度。但是在互联网上传播的恶意代码数量、种类等都在增加。针对恶意代码数量庞大、传统特征检测覆盖面不够广、准确度不高的问题,提出了在大样本下基于随机森林的恶意代码检测算法。大样本下,将PE文件结构特征和敏感API作为输入特征,采用随机森林算法对恶意代码进行检测。实验结果表明,大样本下,随机森林算法是一种优秀的用于恶意代码检测的算法,即使在恶意代码样本量庞大的情况下,仍然具有良好的分类效果,其在现实应用中具有重要的价值。