项目介绍:

Scavenger 是针对 Hadoop 0. 和 1. 版本 的一款作业监控与自动终止工具,有效管理集群中运行的各类 Job。这些 Job 可能来自 MR脚本Hive SQLPig脚本 等多种来源。在没有专门工具时,集群的作业管理较为混乱,尤其是某些具有过大 Mapper 数量的作业会抢占过多资源,导致其他作业进程的阻塞。

最初,集群管理员通过查看 JobTracker 页面(50030端口)来监控作业,发现问题后进行人工 kill,但这一做法显然效率低且不智能。为此,开发了 Scavenger 项目,自动监控 JobTracker 上的作业,设定最大 Mapper 数量和最长运行时间,超出设定阈值后自动终止作业,并发送邮件报告。

项目目录:

|____common

|______init.pyc

|____common.pyc

|____jobutil.py

|____jobut