一个Python模块,帮助你构建复杂管道的批处理作业。它处理依赖项决议,工作流管理、可视化等。它还附带了Hadoop支持内置的。