近日,阿里云宣布,将推出新一代企业级弹性计算实例规格族ECS g8i。该款计算实例采用CIPU+飞天的技术架构,搭载最新第四代英特尔至强可扩展处理器(代号Sapphire Rapids,SPR),全核睿频p0n达到3.2GHz,性能相比上一代实例最大提升60%以上;网络带宽升级至2 x 100G,提升100%,标配阿里云自研eRDMA大规模加速能力;全面搭载NVMe,支持共享盘;支持可信计算与加密计算等特性。
阿里云弹性计算高级产品专家表示,ECS g8i实例将为游戏、视频直播、电商、金融、医疗、企业服务等行业客户提供优质高效的算力服务,满足其在深度学习、AI推理训练、大数据等应用场景下日益增长的性能需求。
丰富的硬件加速能力和全方位的安全防护,是ECS g8i实例的两大特色。在算力维度,第八代ECS实例g8i选用第四代英特尔至强可扩展处理器,单核通用算力提升的基础上,提供多种硬件原生加速能力,其中AI领域,深度学习训练场景性能提升2倍以上,推理性能提升4倍,加解密、压缩/解压缩等场景下性能提升4倍以上,在统一技术架构下获得更好的场景化性能扩展性,为客户提供超高的性价比。
随着越来越多的大型企业迁移上云,基础设施的安全保障和数据安全也持续受到关注。ECS g8i实例全量搭载安全芯片TPM作为硬件可信根,实现服务器的可信启动,确保零篡改;虚拟化层面,支持虚拟可信能力vTPM,提供实例启动过程核心组件的校验能力;在实例可信的基础上,配合英特尔硬件TEE能力和内存加密TME (Intel Total Memory Encryption)技术,以及阿里云自研的加密计算隔离环enclave,ECS g8i实例进一步实现数据的可用不可见,为大型互联网、新金融、医疗保健、知识产权等业务场景提供了更高安全等级数据保护能力和云上可信运行环境。
其中,内存加密TME技术是新一代ECS g8i实例独具的全新安全加密技术。在该技术的加持下,ECS g8i实例默认全内存加密,加强内存数据的抗物理攻击能力,进一步提升云上数据的安全水位,用户无需对操作系统或应用进行任何改动,即可享受到更高一层的安全防护。
除了算力和安全能力提升以外,阿里云ECS g8i实例的网络及存储I/O均实现大幅演进。存储方面,IOPS最高达100万,全面适配NVMe云盘,存储延时低至百微秒,同时支持共享盘;网络性能方面,物理网络升级至2*100G超大带宽,ECS g8i实例PPS最高达到3000万,同时升级至eRDMA网络架构,具有业界首个大规模弹性RDMA加速能力,网络延时最低8微秒,为数据库、AI、大数据等常见应用带来进一步的性能跃升。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。