7 月 22 日,2022 GIAC 全球互联网架构大会在深圳隆重召开。GIAC 是中国地区规模最大的技术会议之一,专门面向架构师、技术负责人及高端技术从业人员等人群。作为互联网技术的年度盛会,大会汇聚了 100 多位来自一线互联网企业的资深技术专家,围绕元宇宙、人工智能、Web3 等热门技术话题展开分享,为所有参会者带来了一场技术升级与收获之旅。
网易云信音视频架构师饶世铖受邀出席了本次大会,并带来了主题为《新一代音视频架构在元宇宙场景的实践》的分享,全面介绍了元宇宙场景对音视频架构带来的挑战以及网易云信新一代音视频架构的破局之策和实践落地。
掘金「元宇宙」,网易的技术储备
作为元宇宙主题专场的首位分享嘉宾,饶世铖首先介绍了元宇宙的发展历程。“元宇宙”这一概念最早诞生于 1992 年美国科幻作家尼尔·斯蒂芬森的作品《雪崩》,书中以天马行空的想象力构建了一个现实世界与虚拟空间并存的系统;2018 年《头号玩家》的上映使大众对元宇宙产生了具象化的认识;到了 2020 年,Roblox 成功上市彻底将元宇宙引爆出圈,带动了全球科技大厂纷纷入局,基于自身的先发技术优势掘金元宇宙产业。
如此宏大的元宇宙世界,需要哪些底层技术支撑?饶世铖总结,元宇宙的实现需要区块链、物联网、网络及运算、人工智能、电子游戏、交互设计六大技术支撑。而网易自 2011 年起,就开展了 AR、VR、虚拟人、超低延时音视频、区块链、云游戏等元宇宙相关技术储备和规划,是国内最早涉足元宇宙领域的科技公司之一。
在基础设施层,网易拥有了以 WE-CAN 全球智能路由网络、AI 计算平台、AR/VR、区块链、智能硬件等为代表的核心技术。基于这些核心技术,沉淀出了网易智企、网易伏羲、网易星球、易现先进科技等服务平台,并在平台之上形成了一系列可靠的元宇宙解决方案,在游戏、社交、电商、金融、教育、医疗等各个领域进行了最佳实践。
「元宇宙」对传统音视频架构的两大挑战
“元宇宙强调沉浸感、高还原的交互体验,同时场景更综合、复杂度更高,这对传统的音视频架构提出了挑战。”饶世铖表示。
首先,简单的视频通话、语音聊天以及实时互动等交互方式已经远远无法满足元宇宙场景需求,超低延时的音视频、业务数据传输、人脸数据的实时提取、表情和动作迁移、实时语音 3D 音效等关键技术成为元宇宙的重要组成元素。驱动关键技术的创新优化,突破原有音视频相关技术的边界,为用户提供极致的沉浸式体验成为了音视频架构面临的强有力挑战。
其次,元宇宙中的音视频业务复杂多样。很多业务同时具有 RTC、超低延时数据传输、低延时直播拉流等需求,不同需求的 SDK 需要独立集成,接入方式也不尽相同,造成了接入难度大、效率低的难题。如何设计一种好的 SDK 架构,在提供高可用和高稳定功能的同时,通过技术组合的方式将所有业务融合在一起,为用户提供整体的一站式解决方案?这是对音视频架构的第二大挑战。
破局之策,网易云信音视频架构的优化与实践
饶世铖介绍,面对上述的两大挑战,网易云信构建了新一代音视频引擎 NERtcEngine 和新一代音视频融合 SDK NERtcSDK。
新一代音视频引擎:NERtcEngine
NERtcEngine 基于元宇宙实际业务场景专门设计和实现了超低延时数据传输的数据引擎,同时面对元宇宙越来越多的智能算法和 AI 算法,专门对算法集成方式进行了重构,设计和实现了基础算法组件引擎。
在超低延时数据传输架构的设计上,网易云信设计了独立的数据传输通道,在保证原有音视频数据传输通道稳定高效的同时,为其单独制定传输协议、发送/接收控制单元和 QoS 调节策略。此外,网易云信还拥有大规模分布式实时传输网 WE-CAN,是业内首个独立于业务逻辑的传输层基座,并在全球数百个主要国家和地区进行节点部署,符合各个地区的数据安全政策,全面覆盖 IM 消息、实时音视频、直播、点播、白板等产品场景。双管齐下,确保了超低延时的数据传输。
在算法组件引擎架构设计上,网易云信将所有算法集成于统一的接口,集成方式非常友好。同时支持插件化集成,每个算法可作为独立单元以插件化方式,灵活实现算法的定制化集成,且扩展性更强,后续新增算法只需实现对应的集成 API 就可快速便捷地集成到框架中。
新一代音视频业务融合 SDK :NERtcSDK
NERtcSDK 是网易云信新一代音视频业务融合 SDK。在元宇宙业务场景中,更广范围、更深程度的融合能为用户带来更大价值。
以往的业务中,不同需求必须接入不同的 SDK 才能实现对应功能。而在 NERtcSDK 的融合架构设计中,用户只需对接 1 个 SDK 就可同时实现 RTC、虚拟人、低延时直播、超低延时数据传输等业务,这对 3D 虚拟人社交、虚拟实时展会等这类复杂的集成场景来说,极大地提高了用户接入的速度和效率,大幅降低了接入成本。
饶世铖还为大家介绍了网易云信融合 SDK 中一个代表性的融合方案——高接通方案的设计,通过应用保活、融合呼叫、通话辅助的“三板斧”,覆盖呼叫场景中的绝大部分被叫到达的场景,增加呼叫到达率,从而保证应用的接通率。
加速助推「元宇宙」的技术落地
“所有的技术积累都需要在真实的场景落地,才能看到价值。”在介绍了网易云信在元宇宙的技术布局后,饶世铖展示了网易推动元宇宙“由虚入实”的几大案例。
饶世铖认为,元宇宙应用不仅仅是将现实世界搬进虚拟世界,也不只是从线下转移到线上,而是在助力生产效率提升、社会民生改善等方面具有真实价值,并推动相关产业加速发展。
遥感机械助力传统产业数字化转型,在网络环境较差、恶劣的户外作业环境也能通过手机远程操控挖掘机进行生产工作而不必深入现场,不仅降低了劳动强度,也从根本上杜绝了人身伤亡的安全隐患,帮助生产效率的提升。
AI 虚拟客服越来越常见于金融智能虚拟客服、互联网医疗远程问诊、新闻虚拟主播、社交娱乐虚拟偶像、电商虚拟直播等场景。相比于市场上常见的虚拟人方案,网易云信提供了一站式的 SDK,用户仅需对接一个 SDK 即可同时拥有虚拟人、RTC、直播等多项能力。同时,首创客户端和云端双渲染技术,以满足不同客户和场景的实际需求。
网易瑶台是国内首个元宇宙落地产品,区别于传统视频会议的单一呈现方式,瑶台更具虚拟的沉浸感,也更能满足现实世界的切实需求。网易曾将全球投资者大会的举办地搬到了瑶台虚拟世界,来自全球多个国家的 200 多位投资者,通过自己的虚拟形象,交流网易业务的最新动态。整个互动场景便是基于网易云信的 WE-CAN 全球智能路由网络和融合通信能力打造。
除了在元宇宙主题专场的干货分享,网易云信在全球互联网架构大会设置了专门的展位,吸引了大量的现场观众咨询讨论。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。