为了从本质上揭示H1N1病毒分子的变异、流感流行等关系,提出一种构建H1N1病毒进化树新方法。在1902—2013年全球22455条H1N1型禽流感病毒HA蛋白质序列数据的基础上,利用其特征向量构建基于内积的HA蛋白质序列相似度。采用基于相似度的完全聚类图的方法进行数据系统粗粒化的相似信息提取。最后,利用基于模糊邻近关系的结构聚类方法进行H1N1型禽流感病毒HA蛋白质序列的进化树研究,将病毒分为33大类。进一步分析表明,H1N1病毒的变异不仅与爆发时间密切相关,还与所分布地域及地域间的距离有很大关系,即分布地域间的距离越近,爆发的病毒进化的相似程度越高。对大量的病毒进行进化树分析,从宏观角度