数字化时代,业务“在线”是每个企业的常态。作为企业经营管理软件中最关键的应用系统,ERP承载着企业所有的业务流程和数据资产,是企业日常运行的重要依托。因此业务7*24小时“在线”的“可靠性”成为衡量ERP的一大关键指标。
日前,华为宣布实现自主创新的MetaERP研发,完成对旧ERP系统的替换,经历了月结、季结和年结的考验,交出“零故障、零延时、零调账”的满意答卷,证明了MetaERP系统的“可靠性”。这背后离不开华为云GaussDB数据库的支撑。
金融级可靠性,MetaERP的“极致要求”
华为旧ERP系统随华为业务发展运行了20多年,支撑着每年数千亿产值的业务和全球170多个国家业务的高效经营,具备“强一致性”的典型特征:不仅承载华为250多个会计核算场景、140多个核算模板、3000多个核算规则, 还需要完成海外100多个子公司的多准则适配,灵活编排业务规则,当国家会计准则发生变化,不用IT改程序就可以直接调整,对账本的准确性、灵活性和一致性要求极高。
这让MetaERP的替换从一开始就面临着一个“极致要求”:绝对的强一致和高可用,确保单单、单帐、账实一致性,达到金融级的可靠性。如何在替换旧有数据库的同时,达到这样的要求,成为GaussDB团队从一开始就摆在首位的工作。
GaussDB高可用容灾部署满足业务需求
什么样的数据库才有这样的能力?当时,团队面临两个选择,一是继续沿用马来西亚子公司此前使用的业界开源友好的PG数据库,二是使用华为自主创新的华为云GaussDB数据库。最终,GaussDB依托自身的优势,提供同城AZ内、跨AZ、异地跨Region的两地三中心容灾方案,很好地满足了华为业务对MetaERP永久在线的需求。
为了实现数据的强一致性,GaussDB通过DCF(分布式共识框架)模式提升了容灾能力的规格,支持一致性日志复制,在任意节点故障、主备切换情况下保障日志不分叉,并且支持一致性选主,确保任何故障下都不会发生脑裂双主,SLA服务达到了99.99%。
在保证数据一致性的前提下,团队围绕容灾也展开很多研究,支持了流式容灾,突破了基于物理日志的并行复制技术,支撑MetaERP高效完成同城3AZ高可用部署,并且通过异地跨云容灾集群的搭建,实现了异地1700多公里的城市级容灾能力,当一个地方发生故障,另一个地方快速完成容灾集群的切换,保障业务正常运行;6小时以上的闪回能力,避免了人为失误操作导致的数据丢失,同时闪回查询对系统性能的影响极低;
通过三副本数据强一致技术,实现RPO等于零,数据不丢失,安全守护每一笔存货交易的准确记录,交易成功率100%,截至目前,系统运行实现了做到了“数据零丢失、业务永在线”。
GaussDB全面支撑MetaERP稳定运行
为了确保系统足够稳定可靠,整个上线过程中,GaussDB团队进行了多次真实场景的故障演练,比如对准历史故障异常场景,选定了断网和断电演练。对断网场景进行了单机柜断网、整排机柜断网和AZ级断网演练,对断电场景进行了单机柜断电、整排机柜断电和市电掉电演练。做单机柜断电时对西安机柜进行了误下电演练,做整排机柜断电时对贵阳小母线进行了误下电演练,而针对市电掉电对东莞EDCM9模块进行了掉电演练。最后结果显示,无论是在哪种情况下,系统端到端故障都能保证在5分钟之内快速恢复,达到了预期目标。在充分的故障场景测试下,MetaERP的高可用和高可靠能力得到了全面的验证。
可靠性是ERP系统的“生命线”。实践证明,华为云GaussDB完全经受住了这场世界级的攻坚考验,也完全具备支撑大型一体机系统迁移上云的能力,并积累了丰富的经验。未来,华为云GaussDB将一如既往地持续聚焦真实业务场景,潜心研磨数据库根技术,为企业数智化转型保驾护航。

好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。