建议仅对文件类作业或启用了导入阶段表的数据库作业配置自动重试,避免自动重试重复写入数据导致数据不一致。
说明
如果通过DataArts Studio数据开发使用参数传递并调度CDM迁移作业时,不能在CDM迁移作业中配置“作业失败重试”参数,如有需要请在数据开发中的CDM节点配置“失败重试”参数。
说明
如果通过DataArts Studio数据开发调度CDM迁移作业,此处也配置了定时任务,则两种调度均会生效。为了业务运行逻辑统一和避免调度冲突,推荐您启用数据开发调度即可,无需配置CDM定时任务。
CDM迁移作业的抽取并发量,与集群规格和表大小有关。
按集群规格建议每1CUs(1CUs=1核4G)配置为4。
表每行数据大小为1MB以下的可以多并发抽取,超过1MB的建议单线程抽取数据。
说明
迁移的目的端为文件时,CDM不支持多并发,此时应配置为单进程抽取数据。
单作业的抽取并发数,受到作业“配置管理”中所配置的“最大抽取并发数”影响。“最大抽取并发数”配置的是抽取并发总数。
仅当Hbase或Hive作为目的数据源时该参数才显示。
CDM中脏数据指的是数据格式非法的数据。当源数据中存在脏数据时,建议您打开此配置。否则可能导致迁移作业失败。
脏数据要写入的连接,目前只支持写入到OBS连接。
写入脏数据的OBS桶的名称。
OBS上存储脏数据的目录,只有在配置了脏数据目录的情况下才会记录脏数据。
用户可以进入脏数据目录,查看作业执行过程中处理失败的数据或者被清洗过滤掉的数据,针对该数据可以查看源数据中哪些数据不符合转换、清洗规则。
单个map的错误记录超过设置的最大错误记录数则任务自动结束,已经导入的数据不支持回退。推荐使用临时表作为导入的目标表,待导入成功后再改名或合并到最终数据表。
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。
0 条相关评论
相关最新动态
- 探索科技魅力:三款智能旗舰手机推荐,让你体验未来科技生活旗舰手机「探索科技魅力:三款智能旗舰手机推荐,让你体验未来科技生活」
- 先不谈隔空充电,都2021年了,手机快充技术为何还不通用?手机快充「先不谈隔空充电,都2021年了,手机快充技术为何还不通用?」
- 浏览器谷歌手机版谷歌浏览器下载手机版「浏览器谷歌手机版」
- 2k屏手机有哪些(手机国产屏幕排行榜)
- 让iPhone与Win同屏协助更得心应手,PITAKA无线充电座与手机壳、Ciphone手机「让iPhone与Win同屏协助更得心应手,PITAKA无线充电座与手机壳、C」
- 手机摄像头结构与工作原理手机摄像「手机摄像头结构与工作原理」
- 360手机系统更新(360手机系统更新包)
- 华为手机价格大全2022新版华为手机价格大全「华为手机价格大全2022新版」
推荐最新动态
点击排行