本文提出了文本相似度计算的一种新方 法.与其它的文本相似度计算公式相比较.该方法跳出传统的 思想.而是采用码字的方法来表征文本信息的特征.它不仅可 以限于关键字等孤立的信息的表征.还为联合地描述文本信 息提供了可能。其次该方法只是利用模2加等运算.其方便性 是不言而喻的.它完全避免了诸如在欧氏空间中求相似度的 大量乘法运算.可较大地提高计算速度