在预训练大模型催生的人工智能浪潮下,数据已经成为各行各业不可或缺的新型生产要素,同时也面临着一系列棘手挑战:既要保护数据安全,又要利用数据创造经济效益。
让数据可用不可见的“隐私计算”,由此被越来越频繁地提及。有人打了一个形象的比喻:隐私计算就像是一个黑箱,人们不需要看到黑箱内是如何运作的,却可以得到想要运算结果,可以说是“鱼与熊掌”兼得的最优解。
在大厂扎堆的隐私计算赛道中,有一个“黑马”级的创新团队——冲量在线,成立仅三年多时间就跻身国内隐私计算第一梯队,并频频在人工智能应用落地有关的重量级比赛中崭露头角。
首创隐私计算与海光异构加速卡结合,性能比肩国际主流产品
可能不少人对“冲量在线”这个名字还有些陌生,却是隐私计算赛道中名符其实的实力派选手。
2022年6月,冲量在线与中科海光联合推出了全国产化的异构加速隐私计算一体机,将适用于CPU芯片上的CSV技术与海光芯片异构加速芯片直通,利用GPU资源加速TEE中的隐私计算。和市场上的其他可信方案相比,冲量在线的异构加速隐私计算一体机表现出了多方面的优势:
第一,在整个机器学习的训练和推理过程中,数据无需落盘,保证数据不存在隐私泄露的困扰;
第二,基于海光异构加速卡,保证上层基于深度学习框架上的AI应用和隐私计算算法不需要修改;
第三,携手海光,实现底层核心的自主、安全,达成了端到端的软硬件全国产化。
目前,冲量在线基于海光的异构加速机密计算产品已经在中国电信和浦发银行的项目中落地,安全性能可以比肩国际主流产品,是国内首个基于GPU的TEE方案,可同时满足大规模数据训练推理的高性能和安全需求。

打通隐私计算“最后一公里”,需要产业链互促共赢
在冲量在线的异构加速隐私计算一体机方案中,“AI安全开放平台”是一个不可或缺的模块,用于实现AI安全对外共享服务的场景,也就是现在很流行的可信MaaS平台(Model as a Service)。
而冲量在线“AI安全开放平台”的诞生契机,则是第二届光合组织解决方案大赛。通过大赛这一平台,冲量在线加深与了海光的合作。在经历了长达7个月的研发“急行军“后,双方联合推出了“冲量AI安全开放平台”。该平台为政务、金融、算力中心等领域提供安全可靠的AI服务。
银行等金融机构通过“AI安全开放平台”,将成熟应用的AI能力(OCR能力、NLP能力等) 向第三方输出,无需修改AI应用和隐私计算算法,就能对外提供隐私计算AI SaaS服务。这不仅可以保证第三方提交的合同、数据等信息的安全,也能保证银行AI算法的安全性,在全面可控的隐私计算机制下实现数据资产的价值变现。
冲量在线合伙人、解决方案总经理黄淼介绍:“在整个比赛过程中,光合组织给予了非常多的资源支持。比如一些深度学习框架,框架的开发者并未对国产芯片进行适配。比赛过程中,我们向海光提出了大量优化和适配需求,对方基本在一个礼拜内就能解决,可以明显感受到国产软硬件生态的持续改善。”
而国产生态的改善,带来的直接结果就是业务量的激增。黄淼介绍,在某银行AI SaaS服务的安全能力技术提升的项目招标中,参与投标的企业不乏一些知名的金融科技和AI公司,但最终中标的是冲量在线的产品和方案。因为冲量在线对业务的理解更加深刻,譬如如何将模型在国产芯片上运行和优化,对外应该提供什么样的接口,怎么和客户的业务系统进行集成等。
光合组织的第三届解决方案大赛已经启动。大赛设置了集智计划(人工智能)、桃李计划(教育信息化)、堡垒计划(安全技术应用)三大细分赛道,优胜者将赢取超过1000万的资金及资源,参赛者将获得专属技术指导、产业资源对接、品牌推广助力等多维度支持。
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。