吉林大学一个张同学的硕士论文。 对于网页首先用过滤净化算法得到网页的主要内容再进行特征选取,选出有代表性的文本块,并对每个文本块采用指纹算法计算它们的指纹,那么每个文档就可以用一组指纹来代表,这样就可
数据间的相似性度量是进一步分析数据集整体特性的一个重要基础。针对高维数据的相似性度量问题,提出了一种基于子空间的相似性度量方法。该方法先将高维空间进行基于网格的划分,然后在划分后的子空间内计算数据间的
复杂网络的自相似性研究(课件)对自相似问题感兴趣的可以下一下
基于音乐语义标签的音乐相似计算研究是音乐信息检索领域的另一个新的热点。该文提出一种基于标签挖掘的歌曲分类方法,以Last.fm音乐网站上的用户标签为特征进行歌曲相似性研究。文中将文本聚类中常用的潜在语
水下复杂壳体的声学相似性研究,杨德森,王三德,采用有限元和球函数相结合的方法,建立水下复杂壳体——两端带半球壳的弹性圆柱壳的振动、耦合振动和声辐射方程,运用方程分析法
在高速以太网中,针对用户行为的特殊性及数据流五元组的特点,提出了一种自适应相似性匹配算法(ASMA-HN)。该算法充分考虑了数据流五元组的随机性分布特点,通过一种改进的XOR-SHIFT算法将数据流分
针对仿人机器人模仿人体运动问题,从运动轨迹角度比较了基于运动解析方程方法与基于人体运动相似性方法的特点,阐述了相似性运动系统基本结构,分析了图像捕捉与处理、相似性特征处理、相似性运动约束与优化等模块功
对基于流的垃圾邮件行为识别技术进行了研究。根据垃圾邮件与正常邮件通信拓扑具有较大差异的特性, 引入相似度的概念, 提出了一种基于拓扑相似性的垃圾邮件行为识别方法。该方法以收发件人联系表来表征收发件人,
针对名老中医病例的结构特点,设计了一种基于模拟退火的聚类算法对数据库中病例聚类进行全局优化。病例聚类时,根据一般意义的树间编辑距离,提出一种用于判断XML描述的病例之间是否相似的度量(称为XML编辑距
Theexistingmethodsofanalyzingsimilaritiesofbinaryfilesbasedonfunctioncallgraphsaregenerallyineffecti