问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

Flink CDC 系列 - Flink MongoDB CDC 在 XTransfer 的生产实践

发布网友 发布时间:2024-10-14 21:08

我来回答

1个回答

热心网友 时间:2024-10-18 00:01


XTransfer作为专注于跨境B2B电商中小企业的金融服务提供商,通过建立数字化、自动化平台,致力于全球的财资管理。早期,采用全量离线处理方式,数据时效性不足。随着业务扩展,对实时数据的需求增加,促使我们转向实时数仓建设,选择变更数据捕获工具和实时计算引擎。


2021年2月,我们关注到Flink CDC项目,其内嵌Debezium,简化了开发和部署。Flink的实时计算能力与丰富的外部系统接入使其成为理想选择。我们还结合业务实际,利用MongoDB的Change Streams特性,开发了Flink与MongoDB的CDC连接器,并已发布在Flink CDC的2.1版本中,接下来分享实现细节和生产实践。


Flink CDC 功能与MongoDB复制机制

Flink的Dynamic Table API支持流数据,包括Append Mode和Update Mode的变更流。Flink 1.11引入了新的TableSource和TableSink,支持Update Mode的变更日志处理。Flink通过接收外部系统如MongoDB的变更日志,转化为可识别的changelog,从而支持实时定义动态表。


MongoDB的副本集和分片集群中,复制机制决定了数据同步和捕获的复杂性。副本集的oplog记录难以满足Flink对完整变更记录的需求,而Change Streams特性则简化了数据捕获,尤其在分布式环境下。


Flink CDCMongoDB实现

我们利用MongoDB官方的Change Streams和Debezium EmbeddedEngine,将MongoDB的变更事件转换为Flink的UPSERT changelog。Flink通过Changelog Normalize和Change Streams的resume机制,支持从checkpoint和savepoint恢复。


生产实践中的注意事项

使用RocksDB State Backend来减少状态开销。
设置合适的oplog容量和过期时间以确保数据恢复。
针对变更慢的表启用心跳事件保持resume token更新。
自定义连接参数以适应特殊需求。
优化Change Stream的拉取参数以平衡处理速度和内存消耗。
灵活订阅db或cluster的变更,注意权限管理。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
!这叫什么号 百万医疗赔付后是否可以续保 前一年理赔过医疗险还能续保吗? 医疗住院险理赔后还能购买吗? 女生多大后可以不在长身高? 如何不用软件把手机投屏到电脑上手机屏幕怎样投放到电脑上 战时拒绝、故意延误军事订货罪既遂的处罚? 战时故意延误军事订货罪处罚标准 名师1+1导读方案:汤姆·索亚历险记目录 三星sm-g7200打开微信慢,无法正常收看,网速不慢。 吉安泰和旅游景点,泰和周边风景区推荐一下 来个冒险岛 最新血刀强力加点 问下 有没有人 用过七色风软件下载 网站? 喝酒当天同房怀孕了有影响吗 谁有好点的免费网站空间? 怀孕男方喝酒对胎儿有影响吗 备孕期间男人喝酒有什么危害 百度上不小心点了一个不良网站,会中毒吗? 扫描牌是真的还是假的? ...律师手把手教你!(附6种常用民事起诉状模板) 拉德斯基进行曲创作背景 嘉宝果树莫名其妙的落叶 高中毕业了,暑假想在柳州找份发传单或是钟点工,工资当天结算的工作,请 ... 考研学校知道你考了几次吗 我的手机是苹果4s,最近手机的重力感应不知怎么会事失效了,求回复方法... 手机重力感应不行,有哪些可能 苹果五代重力感应自动转屏不行了怎么办 2018年狗年五行属什么 2018五行属什么 登机牌打印提前多久? 打印登机牌的截止时间是多久? 基于Flink CDC 的现代数据栈实践 ...Doris+SeaTunnel 实现多源实时数据仓库解决方案探索实践_百度... 巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践 深入剖析OceanBase 4.3的关键功能 insert触发器列名无效 曹雪芹出生名门,被雍正抄家后,是什么支撑他完成巨著 出生名门,被雍正抄家后,是什么支撑他完成巨著红楼梦 研一学生感觉读研特别累,现在不想读了,我该怎么调整自己的状态?_百度... x5max s是什么处理器 电动车充电器量是五十多幅可以冲48幅的电瓶吗。 新电瓶48幅。充了8个小时还充不满怎么回事 为什么说计算机是二十世纪人类最伟大的发明创造? 3.02千克等于()克? 3千米50米等于多少米 如何提取Word文档中的全部汉字或英文 vivox5max手机内置电池不耐用了怎么激活 无锡的商会聚集在哪?联系方式? 文理学院与大学的区别 美国文理学院和综合大学的区别去哪个留学比较好? 龙盛四季城的项目介绍 龙盛四季城项目介绍