丁杰u黄亮3庹宇鹏〃桑亚飞u张永铮11(中国科学院信息工程研究所北京100093)2(中国科学院大学北京100049)3(国家计算机网络应急技术处理协调中心北京100029)VoL34No.2Feb.2017摘要相关研究具有重要意义。目前,网络流量分类技术主要按照应用类型或者协议类型对网络流量分类,不能够对未知流量和加密流量进行分析和识别。因此提出一种基于n-gram多特征的流量载荷类型分类方法来实现对网络数据包中传输内容的类型的识别,即将流量按照其载荷类型分为文本、音频、视频、图片、可执行文件、压缩加密七类。首先利用阈值筛选出高频连续子串集合,进而在该集合上提取多样化的特征来刻画连续子串的频数分布,最后基于C4