实时作业 #
新建作业 #
step1:点击右上角新建作业,选择实时作业
step2:选择工作空间内数据源,目前可支持kafka的数据源。选择数据源后,系统进入配置界面
编辑作业 #
目前实时作业支持的基础算子包括:过滤、替换、合并字段、关键词提取句子、json提取、字段类型转换、码表标签、自定义算子、自定义脚本(具体算子功能可参与数据开发-算子介绍一章)
支持输出的数据库包括:ES\MYSQL\Oracle\sqlserver\hive
支持输出的形式包括:新建数据源、追加到已有数据源
保存并提交 #
编辑完作业后,可通过“保存并提交”按钮提交,相关配置参数说明如下:
任务名称:必填,用户自由输入
频率:可选一次性任务和周期性任务,选择周期性任务后,允许配置执行的频率和生效范围。
通知模式:目前支持完成后通知、仅失败通知、不通知。默认选中完成后通知。
额外通知邮箱:系统会默认通知任务提交人,如任务完成邮件需要抄送其他人,可使用此功能添加更多邮件。多个邮箱之间请用英文逗号分割
执行间隔:实时作业每次消费之间的间隔,默认10000毫秒
预估最大流量:预计消息队列每秒写入数据量,默认100条/秒
报告统计间隔:任务报告统计间隔,默认每天 (主要显示成功消费数据量、收集报错、异常等,报告详细介绍详见任务列表-任务报告一章)