中国工程院院士 廖湘科
数字经济时代的主要特征就是“软件定义一切”,软件是数字基础设施的重要组成部分,而以操作系统、数据库为主的基础软件,是软件技术的核心,当前已成为国家战略竞争的制高点。伴随着数字化进程的深入,数据库在技术架构、数据管理、数据安全的创新,以及数据科学基础研究、生态建设、“产学研用”深入合作上都面临着非常大的挑战。因此,数据库也是公认的最为复杂,跨技术领域最多的基础软件,其发展难度更大,更需要产业界形成合力、不断创新,来推动数据库产业的高质量发展。如何推动,主要方向如下:
第一,数据库的发展需要有一个能聚合产业链多方并共同长期投入的文化和机制。在国家的“十四五”规划中,首次将软件“开源”列入其中,明确支持数字技术开源社区等创新联合体发展,支撑打造数字经济新优势。因此,数据库也要充分利用开源和发展开源,广泛吸纳全产业力量,打造根植于中国的开源社区,形成创新活力,在合理的社区治理框架和机制上有机协同,最大发挥各方合力。
第二,数据库的发展应充分发挥业界龙头企业的示范带头作用、鼓励大型企业开放软件源代码,并持续贡献。由于数据库设计复杂、开发周期长,大企业在投入和积累上有先天的优势,应鼓励大企业开放创新资源、打造创新平台、提供开发环境和科研基础设施,吸纳更多数据库厂商、应用单位、研发机构以及研究和工程技术人员个体加入,开展核心技术创新、社区文化建设等,逐步形成收敛、可独立演进的数据库根社区,从分散性变成凝聚力量攻关,避免分化及碎片化。
第三,数据库的发展需要产学研用深入合作,用户单位应提供有价值 “真”需求、“真”场景,才能推动数据库跨越式发展。数据库系统涉及的技术链条较长,与上层应用软件、底层操作系统、硬件处理器等关联程度较高,无论是核心研发还是评测基准,以及开源生态等的建设,都需要产学研用各方密切配合,如openGauss已通过项目形式展开与高校和研究所合作,包括CCF-华为数据库创新研究计划等,使得厂商和研究机构间开始形成了较为稳定和密切的合作关系。但产学研用共同参与的合作仍不多,需要多方在合作模式上持续创新,数据库用户单位也应为“产、学、研”提供有价值、有前景的“真”需求、“真”场景,推动数据库领域的跨越式发展。
第四,数据库的发展需要有一个正确的评价和衡量机制。通过完善行业治理体系、深化知识产权保护,打造一个良好的行业发展环境,在全行业推广软件价值评估和软件成本度量标准,进一步突出软件价值导向。充分调动我国广大软件工作者和软件企业的积极性和创造性,为数据库产业可持续发展打造创新土壤。
数据库产业高度复杂,核心技术的创新和生态的构建不是一蹴而就的,要有 “咬定青山不放松”的耐心、信心和决心,稳扎稳打,才能后来居上,实现产业高质量发展。
好文章,需要你的鼓励
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
Meta为Facebook和Instagram推出全新AI翻译工具,可实时将用户生成内容转换为其他语言。该功能在2024年Meta Connect大会上宣布,旨在打破语言壁垒,让视频和短视频内容触达更广泛的国际受众。目前支持英语和西班牙语互译,后续将增加更多语言。创作者还可使用AI唇形同步功能,创造无缝的口型匹配效果,并可通过创作者控制面板随时关闭该功能。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。