apache graphx 源码
阿帕奇火花 Apache Spark是一个开源的分布式集群计算框架。 它在内存上比Hadoop MapReduce快100倍,在磁盘上快10倍。 它可以在Java,Scala,R,Python和SQL Shell上运行。 它具有许多库的堆栈,例如Spark Streaming,SQL和数据框架,以及用于机器学习的Mlib和用于图形处理的GraphX。 以及可以在应用程序中无缝使用的许多其他应用程序。 Apache Spark可以在具有JVM和Apache Spark框架的计算机上作为独立集群运行。 为了利用完整的功能并控制群集的节点,我们在Kubernates,Hadoop Yarn,HDFS或Apache Mesos等群集计算框架上运行它。 我们将使用Hadoop Yarn作为集群计算框架。 GraphX 它是用于图形和图形并行计算的spark的组件。 在较高的层次上,GraphX通过
文件列表
apache-graphx-master.zip
(预估有个6文件)
apache-graphx-master
dataset
sample.txt
43B
facebook_combined.txt
834KB
scala
connectedgraphx.scala
458B
pagerankgraphx.scala
563B
trainglecountgraphx.scala
606B
README.md
3KB
暂无评论