作者:计红梅 来源:中国科学报
谢晓清 受访者供图
自1991年正式引进Unix以来,中国的开源运动到现在已持续了30年。
开源即开放源代码,兴起于软件行业,是源代码开放共享的开发模式。在过去的30年里,开源在世界范围内迎来了大发展,成为全球信息技术发展的重要推动力。
据全球最大开源项目托管平台GitHub统计,2020年较上一年新增了1600万开发者用户,预计2025年开发者用户的数量将达到1亿。这其中,在GitHub的中国开发者数量及开源贡献度增长已成为全球最快。GitHub预测,到2030年中国开发者将成为全球最大的开源群体。
就软件的未来发展而言,开源又意味着什么?6 月 17 日~18日,由中国开源软件推进联盟主办的2021第十六届开源中国开源世界高峰论坛在北京举行。会议期间,《中国科学报》专访了英特尔架构、图形和软件集团副总裁兼中国区总经理谢晓清。在她看来,开源已成为软件的存在方式之一,未来的软件发展一定会越来越多以开源的方式存在。“这肯定是一个趋势。”
在此次大会的主旨演讲中,除了阐释英特尔在开源领域的整体策略,谢晓清重点提及的一个关键词是“oneAPI”。
在过去20多年里,英特尔一直在深度参与开源软件发展。谢晓清表示,他们在Linux内核、虚拟化、云端协同等方面都做了大量工作,希望从底层基础软件到中间件乃至应用层,实现全栈赋能。
以Linux内核为例,从Linux内核社区周期性发布的各大公司对Linux内核所贡献的补丁数量来看,在过去的10多年里,英特尔一直稳居第一或第二的位置。“可以说,我们的软件开源优先原则,在很大程度上促进了开源生态在英特尔架构平台的健康发展。”谢晓清说。
而oneAPI则是英特尔最新推出的开源软件解决方案。它可以提供单一、开放和统一的编程模型,能够简化跨不同架构的开发工作。其愿景是让异构计算变得更加容易。
而之所以推出oneAPI,则与英特尔的两大转型战略相关。基于信息技术的颠覆性变化,目前英特尔正在从一家芯片公司向平台公司转型,同时也在从一家以CPU为中心的公司向包含CPU、GPU和FPGA等多种计算架构的XPU公司转型。“说到底,oneAPI就是围绕这两大转型战略而来的,并在其中扮演着重要的角色。”谢晓清告诉记者。
2019年11月,在2019年超级计算大会上,英特尔正式发布了全新软件行业计划oneAPI。英特尔表示,oneAPI是一个以开发者为中心的平台,将为多架构并存的世界重新定义一种新的编程方式。2020年12月,英特尔oneAPI工具包正式版本发布。
谢晓清介绍,oneAPI 主要由两部分组成:oneAPI行业计划和oneAPI的产品部署,即工具包。其核心是基于C++和SYCL的标准的跨架构编程语言 Data Parallel C++(下文简称 DPC++)。它是英特尔全新开发的编程语言。从并行开发的角度看,基于DPC++ 所开发的软件可实现跑在英特尔 CPU 上,也能够部分跑在其他硬件厂商 GPU、AI、FPGA 上,可以有效减少目前专用芯片编程复杂性所造成的经济和技术成本。
在她看来,只有通过跨平台才能够简化应用程序开发者面向标量、矢量、矩阵、空间等多种架构的软件开发工作,帮助开发者简化异构编程的流程,在性能方面最大程度地加速,提高生产力。
目前,oneAPI面临的问题是软件先行,而硬件尚未跟上。谢晓清表示,未来几个月,英特尔将推出与oneAPI相匹配的硬件产品,以使用户获得实时可见的软硬件平台。她告诉记者,“与oneAPI匹配的GPU产品还在研发当中,今年下半年可以推出。”
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。