近日,以“智联世界,生成未来”为主题的2023年世界人工智能大会(WAIC)在上海圆满落幕。本次大会旨在搭建世界级合作交流平台,共促发展新机遇。全球知名商业领军者和全球创新先锋云集于本次大会,阐述其对于新AI与新商业的见解,其中,加拿大工程院和加拿大皇家学院两院院士、FATE开源社区技术指导委员会主席、微众银行首席人工智能官杨强受邀出席,分享了联邦学习领域的前沿研学成果。
可信联邦学习与联邦大模型,解构大模型时代数据之困
7月7日,在由世界人工智能大会组委会办公室主办,中国信息通信研究院承办,中国信息通信研究院华东分院、中国信息通信研究院云计算与大数据研究所协办的“聚焦·大模型时代AIGC新浪潮”论坛上,杨强发表了“可信联邦学习与联邦大模型”主题演讲。
杨强发表“可信联邦学习与联邦大模型”主题演讲
在大模型迅猛发展的当下,对算力、数据量的极高要求是横亘在中小型机构AI应用之路上的一道难以跨越的鸿沟。正如OpenAI CEO Sam Altman所言,未来模型参数应该向更小的方向发展,或者以多个小模型协作的方式工作。
杨强指出,联邦学习(Federated Learning)能够联合分散的数据、分散的算力,可应用于解决可用数据量不足的问题,从而使多方共建大模型基础设施,为业界提供了前瞻性的解决方案。当前,FATE(Federated AI Technology Enabler)开源社区已经发布了开源的联邦大模型功能模块FATE-LLM,支持各参与方的敏感数据不出本地域的前提下,根据各方实际数据量进行算力投入,联合进行大模型训练。未来,联邦大模型架构将重点发展同构与异构联邦大模型、大模型指导小模型联邦等方面,进一步提升联邦大模型的可用性、易用性。
在联邦学习整体研究与产业落地方面,杨强介绍,“可信联邦学习”(Trustworthy Federated Learning)作为安全可信的多方分布式机器学习范式,具有安全可信、高效可用、可管理、可审计、普惠等核心特征,将更加适配当前产业发展所需综合考虑数据安全、隐私保护与效率的要求。同时,杨强介绍了可信联邦学习最新的前沿研究与应用成果,包括质效均衡的可信联邦学习算法框架,在金融反洗钱等行业场景中的应用等。
携手共建联邦学习开源生态,推动数据要素安全流通
7月8日,在由世界人工智能大会组委会办公室主办,机器之心承办的“AI开发者”论坛上,杨强重点作“可信联邦学习与开源生态”主题分享,重点介绍了隐私计算和联邦学习开源社区与生态。
杨强发表“可信联邦学习与开源生态”主题演讲
据杨强介绍,开源已成为隐私计算技术规模化的其中一个重要途径。FATE开源社区是由联邦学习技术开发者、行研方、产业方及生态伙伴共同组建与治理的协作创新平台,相关参与方可以基于工业级联邦学习开源框架FATE探索联邦学习技术的研究与应用。FATE开源社区以“开源开放,共力创新”为愿景,汇聚了4000+社区用户参与社区共建,覆盖金融、医疗、科研、人工智能等多个领域与场景,不仅已成为全球领先的联邦学习开源社区,还是可信数据流通领域最具影响力的社区之一。
在建立行业标准、推动应用场景方面,FATE开源社区的成员单位共同牵头建立了多项联邦学习技术标准,落地了在企业跨主体的大数据协作、企业异构平台互联互通、多中心医疗发现等多场景下的联邦学习应用实践,共同打造了包含数据提供方、模型提供方、业务提供方、价值中介方等各环节紧密结合的数据要素流通生态。
谈及未来发展趋势,杨强认为联邦学习与开源生态将成为隐私计算、机器学习和数据科学发展的关键驱动力。其中,可探索的重点包括进一步完善联邦学习安全机制;推动跨平台的互联互通;推动数据确权与定价和模型交易;基于“模型和数据集水印”技术的模型审计和模型全生命周期管理;推动联邦学习与大模型、区块链等技术的融合等方面,为未来的智能时代提供核心支持。
好文章,需要你的鼓励
OpenAI 本周为 ChatGPT 添加了 AI 图像生成功能,用户可直接在对话中创建图像。由于使用量激增,CEO Sam Altman 表示公司的 GPU "正在融化",不得不临时限制使用频率。新功能支持工作相关图像创建,如信息图表等,但在图像编辑精确度等方面仍存在限制。值得注意的是,大量用户正在使用该功能创作吉卜力动画风格的图像。
Synopsys 近期推出了一系列基于 AMD 最新芯片的硬件辅助验证和虚拟原型设计工具,包括 HAPS-200 原型系统和 ZeBu-200 仿真系统,以及面向 Arm 硬件的 Virtualizer 原生执行套件。这些创新工具显著提升了芯片设计和软件开发的效率,有助于加快产品上市速度,满足当前 AI 时代下快速迭代的需求。
人工智能正在深刻改变企业客户关系管理 (CRM) 的方方面面。从销售自动化、营销内容生成到客服智能化,AI不仅提升了运营效率,还带来了全新的服务模式。特别是自主代理AI (Agentic AI) 的出现,有望在多渠道无缝接管客户服务职能,开创CRM发展新纪元。
数据孤岛长期困扰着组织,影响着人工智能的可靠性。它们导致信息分散、模型训练不完整、洞察力不一致。解决方案包括实施强大的数据治理、促进跨部门协作、采用现代数据集成技术等。克服数据孤岛对于充分发挥AI潜力至关重要。