最近有一项目要求对大量的药品名称和治疗项目进行模糊(相似度)比较,如果用like%xxx%之类的无法达到要求,如“奶奶个熊”和“奶妈个熊”,用like之类就无能为力了。网上也有一些国外的字符串相似度比较的算法,但几乎都是针对单字节字符串的比较,典型的例子是MSSQL中的字符串相似度比较函数就是此类,对于双字节的中文无效。于是做了这个实例。