koalas:考拉 源码
Apache Spark上的pandas API ·· 通过在Apache Spark之上实现pandas DataFrame API,Koalas项目使数据科学家在与大数据进行交互时更加高效。 pandas是Python中的事实标准(单节点)DataFrame实现,而Spark是大数据处理的事实标准。使用此软件包,您可以: 如果您已经熟悉熊猫,可以立即使用Spark进行工作,而无需学习。 有一个单一的代码库,可同时处理熊猫(测试,较小的数据集)和Spark(分布式数据集)。 我们很乐意让您尝试一下,并通过我们的或向我们提供反馈。 在的实时Jupyter笔记本上尝试考拉10分钟教程。首次启动可能需要花费几分钟。 入门 考拉可以通过多种方式安装,例如Conda和pip。 # Conda conda install koalas -c conda-forge # pip pip inst
文件列表
koalas:考拉
(预估有个156文件)
MANIFEST.in
670B
make.bat
791B
.gitignore
21B
Makefile
641B
10min.ipynb
4.04MB
favicon.ico
15KB
koalas.css
2KB
koalas-logo.png
66KB
koalas-logo-docs.png
18KB
koalas-favicon.ico
15KB
暂无评论