文件是rmd格式,可以直接在r中打开,其中涉及的数据获取:https://trec.nist.gov/data/spam.html, 与《机器学习与R语言》书中数据库同源,但使用了其中的中文文本, 文件名为trec06c