5. 词汇表

Glossary

词汇/图标
系统内释义

数据节点

数据节点是数据任务进行数据集成的原始数据载体。「数据节点」可以是数据库、文件系统、数据仓库、文件、应用,一切存储数据的载体都能成为「数据节点」。

数据节点状态

数据节点状态是系统赋予数据节点的管理状态,其中包括激活、挂起。

激活

激活是指将数据节点的管理状态设置为激活,激活后数据节点在系统内为可用状态。

挂起

挂起是指将数据节点的管理状态设置为挂起,挂起后数据节点在系统内将不可用。

连接参数

连接参数是指在系统连接数据节点时,可选的连接参数,不同类型的数据节点的连接参数不同,可能带有不同的配置含义。

连接验证

连接验证是系统连接数据节点时,提供的连接测试功能,系统将会校验是否可以成功连接与是否开通节点读取方式必要的相关权限。

数据节点基础配置

数据节点基础配置是在系统中连接使用该节点的最小化配置。

数据节点策略配置

数据节点策略配置是将数据节点的使用、配置更加易用的配置选项,统一管理节点的策略配置也有助于提升系统稳定性。

语义映射策略

语义映射策略是通过界面配置的方式,将数据源节点的数据类型、索引、特性等语义与数据目的地的数据类型、索引、特性等语义关联起来的映射配置。

检查点策略

检查点策略是系统记录作为数据源的数据节点的日志打点位置,方便在任务执行配置中选择同步起点。

数据链路

数据链路是将数据任务配置集中管理,统一配置的功能模块。

数据链路基本配置

数据链路基本配置是任务保证数据任务成功运行的基本配置,其中包括数据源配置、数据目的地配置与数据链路配置。

数据源配置

数据源配置是数据任务对数据源读取方式的配置。

数据目的地配置

数据目的地配置是数据任务对数据目的地读取方式的配置。

数据映射

数据映射是将数据源的数据表和字段与数据目的地的表和字段建立映射关系的功能。

表映射关系

表映射关系是数据源的数据表与数据目的地表的映射关系。

字段映射关系

字段映射关系是数据源表中字段与数据目的地表中字段的映射关系。

选择同步列表

选择需要同步的数据源中的数据。

语义映射规则

当前映射配置使用数据源的具体语义映射规则版本,仅可单选。

数据映射--查看数据源一对多关系。

数据映射--编辑读取限制条件。

数据映射--查看数据目的地多对一关系。

数据映射--编辑清洗脚本。

数据映射--查看该表的字段映射。

数据映射--删除该行映射规则。

创建新表

在数据目的地为数据源表选择新建表的映射方式。

创建目的地表

为当前链路中已选在数据目的地为数据源表选择新建表的映射创建目的地表,您可以选择系统创建或导出建表语句自行创建。

未创建

在数据目的地为数据源表选择新建表的映射方式,但未在数据目的地创建表。

选择已有表

在数据目的地为数据源表选择已有目的地表的映射方式。

刷新

刷新目的地数据表信息、表结构。

清洗脚本-样例数据

从数据源中获取后,经系统处理,待写入数据目的地的数据。

清洗脚本-试运行

使用已编辑的清洗脚本测试处理样例数据。

清洗脚本-运行结果

使用已编辑的清洗脚本测试处理样例数据,获取到的运行结果。

清洗脚本-脚本库

脚本库指包含系统预置与用户保存脚本的文件。

写入主键冲突策略

主键冲突策略是在任务写入过程中,处理写入数据与目的地数据有主键冲突的策略。

结构变化策略

结构变化策略是当数据源数据结构发生变化时,系统将为您执行的策略,能够有效避免由于数据源结构变化使任务暂停带来的影响。

增量处理策略

增量处理策略指当数据源产生已同步的数据被删除这样的增量数据时,对这部分数据进行处理从而保证数据一致性的策略。

端到端一致性策略

端到端一致性策略是在任务运行过程中保证数据从数据源端到数据目的地端一致性的策略。

自动重启策略

自动重启策略是在任务运行过程中,任务出现报错自动重启的执行策略。

错误堆栈匹配

系统在判断报错任务是否需要自动重启时,会根据已定义的错误堆栈片段与任务报错的错误堆栈做匹配。

错误队列策略

错误队列策略是任务运行过程中,出现错误数据,系统帮助您处理处理错误数据的执行策略。

错误堆栈

错误堆栈信息是任务运行过程中报错返回的错误信息,因DataPipeline所使用的编程语言是Java,故错误堆栈信息均为Java错误堆栈。

内部节点存储

使用系统内部数据节点存储错误数据、日志数据。

外部节点存储

使用外部数据节点存储错误数据、日志数据,外部数据节点需在系统节点管理中被管理。

预警策略

预警策略是监控任务运行状态、任务错误数据、数据源变化情况并及时通知用户的执行策略。

日志策略

日志策略是指任务配置变更时,任务报错信息以日志形式记录,方便用户查询的策略。

数据任务

数据任务是DataPipeline进行数据同步的最小管理单位。

任务概览

任务概览指通过流图的形式查看全部数据任务及数据任务之间的关系的概况。

任务监控

数据任务监控是将重要任务、故障任务、未激活状态任务、性能关注任务集中监控管理的功能模块。

项目

项目是系统提供的对任务进行逻辑分组管理的单位。

重要任务

重要任务是用户赋予重要程度属性为高的任务。

待完善

数据任务状态为尚未配置完成。

未激活

数据任务状态为配置完成,尚未激活。

故障任务

数据任务收到错误通知没有被处理的任务。

非激活状态

创建完成后,没有被激活的数据任务状态。

性能关注

性能关注是将延迟时间较长的增量任务、同步速率较慢的全量任务集中展示的功能。

延迟时间

最近写入数据的时间减去该数据产生时间。

未分组

尚未进行项目分组的数据任务的集合。

参与人

任务/链路/节点权限控制功能,数据任务/链路/节点仅对参与人可见,参与人可修改可见任务/节点/链路。

读取数据量

· 指 DataPipeline 从数据源已读取的数据量。

· 当 DataPipeline 系统重启,会重新读取数据,若源端没有主键则重复读取的数据量会记录到已读取数据量里。

写入数据量

· 指 DataPipeline 已处理的数据量,这里包括:同步到数据目的的数据量和进入到错误队列的数据量。

· 当 DataPipeline 系统重启,会根据断点续传机制从上一个写入记录点开始重新写入部分数据,但这部分数据会记录到已写入数据量里。

错误队列数据量

指已读取的数据中系统判断无法写入到数据目的地,而异步放到错误队列中的数据量。

读取速率

指任务当前对数据源的读取速率。

处理速率

指任务当前对数据目的地的写入速率,多个数据目的地,展示其速率之和。

消息列表

系统展示数据任务状态变更及部分配置变化的通知区域。

关联任务数量

该数据链路关联数据任务的数量。

任务映射-传输队列设置

针对此条数据映射的传输队列设置。

任务映射-batch设置

针对此条数据映射的写入Batch拆分设置。

同步方式

同步方式是指定数据任务同步的方式,包括增量同步与全量同步。

· 增量同步:读取数据库日志以获取数据增量或通过增量识别字段获取增量,将增量数据同步至数据目的地。

· 全量同步:将全量数据同步至数据目的地。

全量初始化

即进行增量数据同步之前先进行一次全量同步,以保证数据目的地数据与数据源的一致性。

同步起点

在进行增量同步之前不进行全量同步的情况中,在日志增量获取模式下指定日志读取起点,以明确数据从哪个snapshot开始同步。

Binlog Position

MySQL数据库Binlog日志获取的记录位置。

Binlog 文件名称

MySQL数据库Binlog日志文件名称。

GTID

MySQL数据库Binlog日志GTID。

Change Tracking Version

MS SQL Sever数据库的Change Tracking功能提供的日志记录点。

PostgreSQL LSN

PostgreSQL数据库的日志记录点。

LogMiner SCN

Oracle数据库通过LogMinner方式获取日志的记录点。

任务执行时间

任务开始执行的时间。

任务执行方式

数据任务的执行方式,与同步方式强相关。

· 监听模式:通常用于日志模式增量获取,监听日志是否有增量。

· 定时模式:通常用于全量同步,设置任务定时开关。

同步前清空目的地

同步前清空数据目的地中的数据,有助于保持数据一致性,无主键数据的唯一性。

目的地更新方式

目的地更新方式指将数据目的地清空后再进行数据写入,分为下列两种方式:

· 清除数据(truncate & insert):执行清除数据目的地表数据语句,清除后执行插入语句进行数据同步。

· 删除重建(drop & create):执行删除目的地表语句,删除后新建数据目的地表进行数据同步。

数据源读取资源设置

数据源读取进程运行的资源组的分配设置。

数据目的地写入资源设置

数据目的地写入进程运行的资源组的分配设置。

读取速率限制

数据任务对数据源的读取的速率限制。

动态限速

为了避免读取数据过多过快,同时写入速率过慢导致的数据传输缓存过大触发缓存清除策略导致的数据丢失的功能。

读取并发限制

数据任务对数据源读取的并发限制。

写入速率限制

数据任务对数据目的地写入的速率限制。

写入并发限制

数据任务对数据目的地写入的速率限制。

任务限制配置-Batch设置

数据任务对数据目的地写入的Batch切分设置。

任务限制配置-传输队列限制

数据任务运行过程中使用的传输队列缓存的限制。

冻结用户

让用户账号冻结并无法登录的操作。

用户分组

系统进行用户分组权限控制的功能。

预警发送组

预警发送渠道的分组功能。

Webhook

发送预警信息的Webhook API配置功能。

预警邮件

发送预警邮件的邮件配置功能。

邮件服务器

不能连接外网情况下,系统发送邮件的邮件服务器配置功能。

最后更新于

这有帮助吗?