image
b10909

这家伙很懒,什么也没写

Ta上传的资源(0)个

hive常见的优化方案ppt

涉及到Hive优化相关的一些常用技巧,当Hive出现数据倾斜时或者负载不均衡等情况,往往会出现耗久,甚至跑不出结果的尴尬场面,这个时候如果计算资源监控显示有没有完全饱和利用,就需要涉及到优化了;

其它 11 0 PPTX 2020-12-29 19:12:39

ElasticSearch常用查询的Java实现

ElasticSearch查询term,terms,match,id查询 ElasticSearch查询refix,fuzzy,wildcard,range,regexp查询 ElasticSearch查询scroll,delete-by-query,bool,boosting,filter,hig

VPN 18 0 ZIP 2020-10-30 23:10:24

项目实战Spark将Hive表的数据写入ElasticSearch Java版本

项目实战:Java一站式解决Hive内用Spark取数,新建ES索引,灌入数据,并且采用ES别名机制,实现ES数据更新的无缝更新,底层采用Spark计算框架,数据较快。

金融 7 0 ZIP 2020-10-28 04:10:24

项目实战钉钉报警校验ElasticSearch和Hive数据仓库内的数据质量Java版本

此篇文章主要选取关键性指标,数据校验数据源Hive和目标ES内的数据是否一致; 因为你不知道将Hive的数据导入到了ElasticSearch后,数据量是否准确,所以需要钉钉报警校验ElasticSearch和Hive数据仓库内的数据质量,注意,这个项目打包后,最好另起一个进程调用,并且开始时间为文

Informix 17 0 ZIP 2020-10-28 04:10:20

elasticsearch HQ.zip

ElasticHQ 是一个基于浏览器的直观和功能强大的 ElasticSearch 管理和监控工具,它提供了对 ElasticSearch 的实时监控、全集群管理、搜索和查询等功能。 ElasticHQ 主要优点如下: 能够实时监控ElasticSearch的集群和集群节点 能够管理索引、映射、分片

Veritas 13 0 ZIP 2020-08-29 08:08:37

城市GDP_总人口数据_清洗后截至2019.xlsx

截至2019年中国各大城市GDP,人口数统计数据整理;数据来源于百度百科,国家统计局等公开数据,个别城市上报的比较慢,只能采用距离2019年更近的年份数据,作为城市GDP,人工的统计标签。

Hive 20 0 XLSX 2020-08-19 23:08:58

数据库原理PPT课件.zip

共四章内容,适合数据库初学者,数据库PPT教学;分别为 第一章:关系代数 第二章:SQL语言 第三章:关系数据理论 第四章:数据库设计

数据库 14 0 ZIP 2020-06-20 17:06:28

hive2.3.5配置文件.rar

Hive的配置,选定一个Hive的master,其他的节点为slaves,master和slaves的配置略有不同,不是完全照搬,准确的来说,应该是只有一个节点是Hive的服务器节点负责和元数据库以及集群内部通信,其他的Hive节点其实是装的client,这些节点在访问元数据库时,先会内部跳转到Hi

其他 8 0 RAR 2020-06-19 02:06:45

MobaXterm_Personal_1

一款免安装的远程terminal桌面管理软件,适合在windows平台访问linux服务器等功能,可以手动将windows文件拖入linux目录下,安全、方便;x-shell有的功能都有,而且免费!

平台管理 21 0 EXE 2019-09-14 23:09:55