项目介绍:
Scavenger 是针对 Hadoop 0. 和 1. 版本 的一款作业监控与自动终止工具,有效管理集群中运行的各类 Job。这些 Job 可能来自 MR脚本、Hive SQL 或 Pig脚本 等多种来源。在没有专门工具时,集群的作业管理较为混乱,尤其是某些具有过大 Mapper 数量的作业会抢占过多资源,导致其他作业进程的阻塞。
最初,集群管理员通过查看 JobTracker 页面(50030端口)来监控作业,发现问题后进行人工 kill,但这一做法显然效率低且不智能。为此,开发了 Scavenger 项目,自动监控 JobTracker 上的作业,设定最大 Mapper 数量和最长运行时间,超出设定阈值后自动终止作业,并发送邮件报告。
项目目录:
|____common
|______init.pyc
|____common.pyc
|____jobutil.py
|____jobut
暂无评论