**Vaex是一个开源的DataFrame库**,它可以对表格数据集进行**可视化、探索、分析,甚至机器学习**,这些数据集和你的硬盘驱动器一样大。**它可以在一个n维网格上每秒计算超过10亿(10^9)个对象的平均值、和、计数、标准差等统计信息**。可视化使用直方图、使用直方图、密度图和3D立体渲染进行可视化。为此,**Vaex采用了内存映射、高效的外核算法和延迟计算等概念来获得最佳性能(不浪费内存)**。 本文是上述介绍的.md笔记档,为一个刚好超出RAM范围(如50GB甚至500GB的数据集)的数据集做分析,又不能破费成本的设置一