6月27日下午,在推动成渝地区双城经济圈建设重庆四川党政联席会议第七次会议座谈会举行期间,中央媒体与成渝头部媒体组成的采访团,探访了西部(重庆)科学城先进数据中心,了解“东数西算”工程背景下,全国一体化算力网络成渝国家枢纽节点的建设情况。
据报道,西部(重庆)科学城先进数据中心肩负着重庆在“东数西算”工程中的重任,是全国一体化大数据中心成渝枢纽节点的重庆数据中心集群起步区之一。
该先进数据中心由中科曙光承建,因采用多种创新技术,使其成为东数西算项目中整体国产化率、绿色节能技术等位居前列的先进数据中心。在绿色节能方面,其应用了曙光浸没液冷技术、余热回收、绿色建筑等多种节能技术方案,使整体PUE可降低至1.144的节能水准,并成为国内率先符合绿建三星标准的数据中心。在安全方面,先进数据中心的计算设备基于国产处理器研发,实现了从核心硬件到应用与运维服务的全栈安全可靠。
区别传统数据中心,西部(重庆)科学城先进数据中心提供的多元算力可同时满足科学工程计算、人工智能、云计算、大数据等多场景应用需求。此外,该先进数据中心通过曙光云计算平台,实现计算节点的全域云化,有力支撑重庆乃至西南地区城市管理、智慧医疗、自动驾驶等应用发展,成为西部数字信息基础设施的重要战略载体,筑牢成渝地区数字经济底座。
好文章,需要你的鼓励
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。
这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,发现较大模型表现更好,纯强化学习训练优于监督微调加强化学习,且训练数据的类型比数量更重要。这些发现对开发既具推理能力又保持视觉准确性的AI系统具有重要意义。
这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具有任务相关性(如逻辑任务中的语法熵AUROC>0.93)。他们的轻量级信号融合方法能减少14-100%的错误,仅需最小弃权,将大语言模型驱动的形式化转变为可靠工程学科。研究揭示当模型正确理解逻辑关系时会产生稳定的语法模式,为判断何时信任模型提供了可靠指标。
来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。