掘金 人工智能 07月01日 14:29
汇金资损防控体系建设及实践 | 得物技术
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文深入探讨了得物在汇金业务中构建和实施资损防控体系的经验。文章详细介绍了从需求评审到线上监控的全流程防控措施,涵盖了事前、事中、事后三个阶段的关键活动。通过挖掘资损规则、选择合适的实现方式、以及运营维护,得物成功降低了资损风险,提升了客户满意度,并建立了高效的日清处理流程。文章还分享了资损防控的实践成果和未来的规划,为其他平台提供了宝贵的借鉴。

✅ **事前防控:** 在项目发布前,通过需求评审、研发设计评审、测试用例评审和稳定性项目评审,从需求、代码、线上核对和监控等方面,预防资损问题的发生。

✅ **事中响应:** 针对生产环境中的问题,建立快速响应机制,确保重资损链路在1分钟内发现问题,并在5分钟内介入处理;非资损链路则采取D+1的发现和修复策略,保障资金安全。

✅ **事后止损:** 发现问题后,采取快速止损措施,力求在10分钟内解决增量问题;针对存量问题,制定相应的修复方案,并通过预案或代码修复来降低影响,确保问题得到有效解决。

✅ **规则挖掘与度量:** 通过资损字段覆盖、业务指标覆盖和跨域资金安全覆盖三个维度,全面挖掘资损规则,并通过建立核对场景分层覆盖策略进行度量,确保资损防控的有效性。

✅ **运营与保鲜:** 实施迭代需求运营机制,确保资损场景的分析与布防;通过保鲜管理策略,及时发现和治理僵尸规则,保证资损规则的有效性和质量,持续优化防控体系。

一、为什么要做资损防控

随着互联网电商平台竞争的加剧,各平台的业务复杂度不断提升,线上环境的稳定性面临更大挑战。在汇金领域,由于其高资金属性,除了确保链路可用性达到99%以上,防止资损亦成为关键保障事项。得物汇金业务涉及复杂的资金流和大额资金敞口,因此实施资损防控尤为重要。

经过不断的演进与发展,我们已经沉淀出一套汇金资损防控体系的方法论,并在实践中取得了一定成效。因此,我们希望通过知识梳理与分享,鼓励大家共同交流学习,持续推进资损防控的提升与优化。

二、如何做资损防控

整体方案:

开展思路:

根据平台特性,涉及到交易和资金流,就会考虑到是否会发生资损,那么如何避免产生资损,总结出一套适合业务特点的方法便成为资损防控的关键。汇金平台和业界内的其他平台采用的资损防控方法论基本一致,但是不同的每个阶段所覆盖的产出的内容不一样。

从项目全生命周期来看,已发布时间和出现问题时间为时间点,发布时间前的阶段为事前阶段,出现问题的时间点为事中阶段,出现问题后应急响应为事后阶段。

三、资损防控产出阶段

对于项目实施阶段,当承接新功能、新建系统或者分析存量系统时,如何判定是否要做资损防控,可以从两个角度出发分析:信息流或者资金流。资金流和信息流之间是相互依赖的。当业务需求中涉及资金流时,系统要实现业务需求,那么系统之间就要设计信息如何流转最终完成资金流转。当系统中存在资金字段的信息流时,可最终推导出直接或者间接的资金流。资金流通过信息流实现资金流转,信息流是资金流转的载体。所以当信息流中存储或者涉及资金交互,资金传递时,就要做资损防控,分析资损场景及如何编写资损脚本。

对于项目发布后阶段,当项目前期如果没有做资损防控,那么也可以从线上稳定性来看是否要做资损防控。一般可以从线上故障、线上工单等结果分析需要做的资损场景有哪些。从线上问题来看可以比较直观的看到缺少哪些防控手段并做针对性的补充,这样能起到立竿见影的效果。这种是从问题点切入的方法进行分析跟进,但比较好的做法是从面上进行分析,集合需求、问题全面分析,从多个点同时作为抓手判定资损防控的必要。

以上两个方法,均在汇金域进行了实践,在项目发布前和发布后都会进行资损防控补充。

四、如何挖掘及度量资损防控规则

当要实施资损防控时,如何挖掘实施资损规则变得尤为重要。当规则挖掘的不对或者偏少,不利于及时发现问题。当规则过多时,对规则的投入成本会变高,规则保鲜会成为挑战,最终也会影响到发现问题的及时性。

那么如何比较全面的挖掘资损规则呢?目前汇金域从三方面切入,分析资损规则并推进资损防控覆盖的成熟度度量。我们从这3方面进行资损规则分析并编写规则脚本,完成资损布防。

资损字段覆盖【字段】

当系统链路涉及的数据库有资损字段时,在Dcheck平台上做资损字段标记,资损字段标记资损,非资损字段标记非资损。从字段上挖掘到要有资损规则覆盖。当在Dcheck上编写完对应规则后,要进行字段和规则的绑定,维护字段和规则之间的关联关系,这样也可以在报表上看出来资损字段是否有对应的线上布防能力。

字段层面覆盖是比较简单可以做到的资损规则分析,常见的资损字段如金额、币种、单位、汇率、计算公式、数量、日期、状态等。如果链路中涉及这些字段,都可以进行对应的规则实施和布防。一般此类字段覆盖的规则可以通过实时核对实现,这种正确性时效要求比较高,如果存储不正确也比较容易发现问题。资损字段覆盖是比较入门并快速上手的手段,但不能作为发现全部资损问题的手段之一。除此之外,还需要通过其他方式挖掘规则。比如字段内容正确,但是其他指标异动方面较大有影响,这种从字段覆盖层面无法发现问题。

业务指标/场景覆盖【业务】

不同的业务域关注的指标不一样,但可以通过观测这些指标可以发现潜在的问题,进而避免可能产出的投诉或者扩大影响。常见的业务指标比如:时效性巡检、成功率异动巡检、失败率异动巡检、中间态异动巡检或者其他指标异常巡检。通过对这些指标的监控覆盖,可以补全数据正确但系统有问题的发现手段。一般业务指标类的覆盖时效性不高,非实时核对方式实现,可能是D+h或者离线D+1方式实现。

上下游资金安全覆盖【跨域】

资损字段或者业务指标覆盖,更多的是聚焦在内部的稳定性上面,对于和外部间资金覆盖较少。当然资损字段可能也会涉及到外部之间的核对,但上下游之间的资金安全覆盖会涉及更多,可能是直接的上下游资金覆盖,或者全链路上的非直接上下游的资金场景覆盖。常见场景如:下单支付场景,订单域的支付金额和支付域的金额、状态一致性check,各种费用项的一致性校验;采购结算付款链路,付款场景下的金额要和采购结算单据的金额币种保持一致等。通过在发生资金流转的时间,做上下游资金安全check,能和业务侧的金额做校验,进而保证流转的资金安全。

业务域度量探索实践效果

五、如何选择资损实现方式

得物实现资损防控的平台为Dcheck平台,作为实现线上核对的平台,支持资损场景核对或者非资损场景核对,从时效性上实现了实时核对或者定时巡检,也支持配置变更的核对。数据源上支持监听生产环境数据库的binlog消息,连接离线数仓、连接业务库。支持语言上可以用Groovy语言编写核对脚本,离线数仓或者通用SQL编写SQL脚本进行核对。同时支持对编写的脚本进行演练,检查脚本有效性。当发生报警后设置通知群@到具体人进行日清处理。业务域可以根据业务特性灵活选择不同的实现方式满足业务目标。平台本身支持的能力比较多样化,灵活性也比较强,支持各种变更的核对。

六、如何做资损防控运营

迭代需求运营

如何做资损规则保鲜

如何做资损规则日清SOP

明确目标及范围:针对业务巡检、实时核对报警,梳理告警跟进SOP,形成闭环处理问题流程,确保资损防控处理的高效性和处理一致性,提升日清率,降低误报,提升有效问题发现。针对资损问题进行日清,同时也是资损成熟度的指标,随迭代运营开展。非资损问题发生报警同时也会进行日清处理。

具体的操作步骤:说明资损防控告警运营的具体步骤,见下图,需要清晰易懂,确保操作性强。

责任人:说明具体步骤对应的责任人,以及不同步骤需要知会的人,确保问题有效推进解决。

监督措施:定期评估SOP的实施效果,并进行必要的改进。监督机制的设计应该确保SOP的执行情况得到有效监督和管理,保障SOP的实施效果。

各步骤定义说明:

资损发现问题复盘模版:

示例:

七、资损防控实践及收益

汇金域通过资损防控专项的实践,不断总结沉淀出一套体系化的方法:需求识别资损规则-->如何分析资损规则-->如何选择实现技术。此方法可以降低人员对资损防控专项的学习门槛,提升学习效率。通过挖掘资损规则的方式,可以较快分析产出资损规则。通过学习实现方式,能较快的选取合适的实现方式,减少试错成本。

自2024年全年至2025年5月共完成了520+个规则,发现了160+个问题。其中5+个问题为资损问题,155+个非资损问题。有效遏制了线上的资损发生和有效保障了线上稳定性。

利用Dcheck手段,降低客诉明显。

八、总结及规划

经过汇金在资损防控专项的体系化建设及实践,取得了显著进展。从事前挖掘资损规则、代码预防性建设,事中及时布防资损规则、巡检规则、开发添加监控,事后及时执行预案以及补充未布防场景规则,以及经过各种挖掘资损方法的探索及分享,大部分员工具备资损防控意识和资损规则挖掘、布防、日清保鲜的能力。并且在整个推荐过程中,研发测试协同分工,共同保障及推进线上稳定性稳步提升。目前体系化流程已初见成效,后续除常态化运营继续开展外,让全员具备资损防控意识,同时也会重点治理以下环节中的痛点问题,不断提升专项的ROI。

往期回顾

1. 给Javaer看的大模型开发指南|得物技术

2. Cursor Rules优化实战:构建高效稳定的AI代码生成规范体系|得物技术

3. 一致性框架:供应链分布式事务问题解决方案|得物技术

4. Redis 是单线程模型?|得物技术

5. 得物社区活动:组件化的演进与实践

文 / 文姬

关注得物技术,每周更新技术干货

要是觉得文章对你有帮助的话,欢迎评论转发点赞~

未经得物技术许可严禁转载,否则依法追究法律责任。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

资损防控 资金安全 得物 风控体系
相关文章