MaleX:针对恶意软件研究者的精选恶意软件和良性Windows可执行文件的数据集 源码
男X MaleX是恶意软件和良性Windows可执行文件示例的精选数据集,适用于恶意软件研究人员。 数据集包含1,044,394个Windows可执行二进制文件,其中864,669被标记为恶意软件,而179,725被标记为良性。 该数据集具有合理数量的样本,足以测试数据驱动的机器学习分类方法,还可以在可伸缩性和适应性方面衡量设计模型的性能。 频域中的恶意软件可视化 在频域中可视化恶意软件的动机是由于文学中恶意软件的“稀疏”特征表示形式,通常是从二进制文件的原始字节或反汇编的指令(n-gram,n-perms)中提取出来的。 将给定的可执行二进制文件读取为16位带符号十六进制向量,并将其划分为相应的二位字节(n-gram字节,n = 2)。 例如,对于字节流0a1bc48a ,对应的二元组将为0a1b , 1bc4和c48a 。 然后,我们使用二元语法频率计数来获得尺寸为256x256的
文件列表
MaleX-master.zip
(预估有个4文件)
MaleX-master
LICENSE.md
34KB
figs
overview.png
113KB
comparison.png
109KB
README.md
5KB
暂无评论