orc:Apache ORC 用于Hadoop工作负载的最小最快的列式存储源码

motherly6482 20 0 ZIP 2021-02-06 06:02:51

ORC是一种专为Hadoop工作负载设计的自描述类型感知列式文件格式。它针对大型流读取进行了优化,但具有集成支持,可快速查找所需的行。以列格式存储数据使阅读器仅可以读取,解压缩和处理当前查询所需的值。由于ORC文件可识别类型,因此编写器为该类型选择最合适的编码,并在写入文件时建立内部索引。谓词下推使用这些索引来确定特定查询需要读取文件中的哪些条带,并且行索引可以将搜索范围缩小到特定的10,000行集合。 ORC支持Hive中的完整类型集,包括复杂类型:结构,列表,映射和联合。 ORC文件库该项目同时包括Java库和C ++库,用于读写优化行列(ORC)文件格式。 C ++和Java库

文件列表

orc：Apache ORC-用于Hadoop工作负载的最小，最快的列式存储 (预估有个1782文件)

TestMatch.cc 194KB

TestRleDecoder.cc 175KB

TestDecompression.cc 29KB

TestByteRle.cc 86KB

TestColumnPrinter.cc 21KB

TestWriter.cc 63KB

TestPredicateLeaf.cc 35KB

TestInt128.cc 22KB

TestColumnReader.cc 180KB

TestSearchArgument.cc 22KB

ColumnPrinter.cc 22KB

Reader.cc 46KB

Timezone.cc 28KB

Writer.cc 19KB

ColumnReader.cc 62KB

PredicateLeaf.cc 26KB

RleEncoderV2.cc 26KB

Compression.cc 36KB

ColumnWriter.cc 99KB

TypeImpl.cc 23KB

用户评论

暂无评论

LaTeX用于跟踪我的LaTeX工作的存储库源码

胶乳跟踪我的LaTeX工作的存储库是的,全都是法文...

9 2021-02-24
Tesseract ORC编译运行需要用的组件cppan master Windows client.rar

Tesseract-ORC编译运行需要用的组件cppan-master-Windows-client

9 2021-02-21
hadoop集群的搭建apache

详细的介绍了在hadoop的安装过程，附带每一步的截图，适合于初学者，以及重点介绍了mapreduce的原理以及简单地应用实例。

47 2018-12-29
coolpdfreader最小最快的PDF阅读器

当前，PDF应用十分广泛。例如电子书籍、文档，各类考试（公务员考试、研究生入学考试等）的准考证等等，都是PDF格式。但是由于PDF阅读器使用较少，十分不便。这这款PDF阅读器只有不到1M的体积，可以保

34 2020-02-03
TCC最小最快的C编译器

现在编译后最小，速度最快的C编译器。可进行嵌入编程。

44 2019-03-05
docker hadoop Apache Hadoop Docker映像源码

docker-hadoop:Apache Hadoop Docker映像

16 2021-02-06
臭氧适用于Apache Hadoop可扩展冗余和分布式对象存储源码

阿帕奇臭氧 Ozone是面向Hadoop和云原生环境的可扩展,冗余和分布式对象存储。除了可以缩放到数十亿个大小不同的对象外,臭氧还可以在容器化环境(例如Kubernetes和YARN)中有效运行。

5 2021-02-22
fastJSON最小最快的多态JSON序列化程序源码

fastJSON 最小,最快的多态JSON序列化器请参阅此处的文章:[ ]( ) 另请参阅安全警告 HP Enterprise Security Group引起了我的注意,使用$type扩展名可能

10 2021-02-06
ORCCalculator在给定组件变量例如功率面积和体积的情况下用于计算ORC有机排名周期系统的货币成本的工具源码

-ORC计算器-===有机排名周期系统计算器=== + / ** +目录+ --------- +1。简介+2。要求+3。配置/测试+4。 API连接+5。关于+ --------------

1 2021-04-21
node connect pg simple用于ConnectExpress的简单最小的PostgreSQL会话存储源码

简单连接PG 用于Express / Connect的简单,最小的PostgreSQL会话存储安装 npm install connect-pg-simple npm安装模块后,您需要在数据库中创建

8 2021-02-07

orc:Apache ORC 用于Hadoop工作负载的最小最快的列式存储 源码

文件列表

用户评论

推荐下载

orc:Apache ORC 用于Hadoop工作负载的最小最快的列式存储源码