|
一、Azkaban 介绍
1.1 背景
一个完整的大数据分析系统,必然由很多任务单元 (如数据收集、数据清洗、数据存储、数据分析等) 组成,所有的任务单元及其之间的依赖关系组成了复杂的工作流。复杂的工作流管理涉及到很多问题:
如何定时调度某个任务?
如何在某个任务执行完成后再去执行另一个任务?
如何在任务失败时候发出预警?
......
面对这些问题,工作流调度系统应运而生。Azkaban 就是其中之一。
1.2 功能
Azkaban 产生于 LinkedIn,并经过多年生产环境的检验,它具备以下功能:
兼容任何版本的 Hadoop
易于使用的 Web UI
可以使用简单的 Web 页面进行工作流上传
支持按项目进行独立管理
定时任务调度
模块化和可插入
身份验证和授权
跟踪用户操作
支持失败和成功的电子邮件提醒
SLA 警报和自动查杀失败任务
重试失败的任务
Azkaban 的设计理念是在保证功能实现的基础上兼顾易用性,其页面风格清晰明朗,下面是其 WEB UI 界面:
|
|