大数据时代的来临日益凸显数据挖掘技术的价值。文本挖掘作为数据挖掘的研究分支,对非结构化数据的知识发现有重要意义。高血压患病人群广,发病率高,治疗药物种类繁杂,寻找其中的用药规律,是临床医学的一个重要方向。基于文本挖掘技术,从在线医疗网站获取医患互动论坛数据,进行文本预处理,基于TFIDF算法发现高血压常用中西药、非药物治疗、并发症用药特点等,结合关联规则算法挖掘“症药”关系,有益于高血压的临床判断及用药研究。另外,验证了在线医疗网站医患互动数据用于疾病研究的可用性和效果。