从2022年9月起,全国计算机等级考试(NCRE)将迎来新成员openGauss。经过近两年的筹备,科目代码为68的openGauss数据库程序设计即将入驻NCRE。
openGauss定位为面向企业核心业务场景的开源数据库,就企业对高性能、高可用、易运维及数据资产安全的核心诉求,提供了丰富的数据库內核技术能力以及其他开源数据库少有的企业特性,适用于高并发、大数据量、以联机事务处理为主的交易型场景。截至目前,openGauss已在银行、保险、证券、运营商、政府、能源、制造等国家关键基础设施及重点行业的核心系统中大规模落地应用。
以openGauss开源社区为平台,鼓励开放合作、拥抱创新、贡献社区。2019年9月19日,在华为全联接大会上,华为将GaussDB数据库开源,开源后命名为openGauss。2020年6月30日openGauss数据库源代码正式上线以来,openGauss社区与云和恩墨、海量数量、神舟通用等国內数据库头部企业达成合作伙伴关系。2021年9月,由中国移动、中国电信、中国联通、工商银行、清华大学、华为等18家单位共同成立openGauss社区理事会,开启openGauss开源社区的“共建、共享、共治”的新篇章。当前已有宝兰德、天翼云、柏睿数据、快立方等80+企业加入社区组织,社区生态蓬勃发展。
图:2020年6月30日,openGauss数据库源代码正式上线
图:2021年9月,18家单位共同成立openGauss社区理事会
NCRE拥有庞大的考生群体,自1994年首次开考,至今已累计报考考生9700万人次,近年来平均每年600万人次,单个科目每年可达几十万甚至上百万人次,是大学生群里报考规模最大的考试之一。NCRE在全国有2000多个考试点。此次openGuass加入全国计算机等级考试,意在通过以考促学,为国家数字经济发展做好人才培养和储备。
2020年4月10日发布的《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》中,技术和数据成为未来市场经济的新生产要素,随着数字经济的发展,数据库的构建在新型基础设施建设中是底层基石,新基建信息基础设施产业的核心技术人才近年来处于供不应求状态。智联招聘发布的2020年新基建产业人才发展报告显示,2020年底信息基础设施产业核心技术人才的缺口达到417万人。
中国ICT(信息与通信技术)产业一直面临缺芯少魂的困境,华为希望联合产业各方通过开源,让产业界参与进来,共同“铸魂”。未来将从技术创新、生态构建、商业推广、开源建设、人才发展五个方面持续投入和推动根技术生态发展。
此次NCRE在考试科目上的调整也是对未来人才培养规划的一次试水,共同构筑起数字基础设施的统一生态,承担起打造中国基础软件根的历史使命,面向全世界,为世界提供更优选择。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。