在导入大批量数据时,如果没有显式地指定“stringsAsFactors = FALSE”,默认会将所有的字符串转换为因子,导致数据处理速度较慢。示例数据如下:查看数据概要,发现默认将字符串转换为因子,并进行了分组计数概要如下:但这样的分组计数并没有意义,所以需要利用“as.character”转换为字符,如下:再次查看概要,如下:可以看到,概要中已经没有了分组计数,但多了总数计量,如果要恢复分组计数,则需要重新创建因子,如下:结论在导入大批量数据时,为了提高性能,尽可能分两步走:1. 显式指定“stringsAsFactors = FALSE”;2. 依次将所需要的数据列(向量)转换为因子;在R语言中,经常会遇到变量名称和字符串相互转换的问题。

R语言:实现因子与字符串的互转

R语言:实现因子与字符串的互转

R语言:实现因子与字符串的互转