以足球之名,致敬热爱与梦想。12月7日,在卡塔尔世界杯如火如荼进行之际,由中国移动携手知名导演陆川打造的世界杯主题短片电影《远征》燃情上线。影片以一场特别的远征,讲述了一对父子踏上追梦之旅、奔赴心之所向的故事,借体育精神传递热爱、希望与坚持,带领众人感受梦想的无限力量。
从激情四射的赛事解说、街头张贴的世界杯海报,到一张“沉甸甸”的世界杯门票,再到座无虚席的卡塔尔世界杯球场,“足球”是贯穿短片电影始终的因素,也指引着球迷父子俩“共赴”远征之路。为了不错过这场期待已久的足球盛会,阿科(柳小海饰)背负着父亲未完成的梦想,怀揣着父子俩对足球共同的热爱,开始了奔赴卡塔尔的旅程。漫漫征途上,他经过白天黑夜,越过山川河流,从东南沿海到雪山高原,跨越长达七千公里的距离,最终来到了卡塔尔世界杯的现场,与全世界不同肤色、不同语言、不同种族的球迷们共享足球狂欢。
“长路漫漫,唯爱与信念支撑我们前行。”此前,《远征》短片电影发布先导片,一幕幕飞驰而过的风景和浓厚的足球氛围,引燃了人们对这场远征的期待;而完整版的正式上线,通过足球的独特魅力与人文意义,唤起了更多人的心理共振。《远征》聚焦世界杯宏大主题下的小人物故事,以足球与电影这两种“通用语言”对话大众,通过温情叙事讲述着超越足球的故事。家庭、父子、中年危机、足球、梦想…..所有的一切凝聚成最真挚的情感,在“远征”中走向诗和远方,传递热爱、希望与坚持的意义。
或许每个人的心底都渴望能有一场说走就走的征途。作为卡塔尔世界杯足球赛的持权转播商,中国移动此次与导演陆川携手打造短片电影《远征》,希望为现实生活感到困顿和压抑的人们,带来坚持梦想、为爱奔跑的力量,告诉大家,在平庸的生活中,我们依然有着最真挚的热爱和坚定,足以跨越山海。
好文章,需要你的鼓励
NOVER是一种创新的无验证器强化学习框架,解决了传统激励训练依赖外部验证器的限制。由伦敦国王学院研究团队开发,它通过计算"推理困惑度"作为奖励代理,使语言模型能在任何文本任务中自主发展推理能力。实验表明,NOVER在一般推理、创意写作、社会智能和多语言能力等多种任务上均优于基线方法,甚至使3B模型接近从671B模型蒸馏版本的性能。此外,其灵活性还支持"反向激励训练"等创新应用,为语言模型训练开辟了新方向。
韩国中央大学研究团队开发了名为CoPriva的基准测试,评估大语言模型遵守上下文安全策略的能力。研究发现,虽然多数模型能成功拒绝直接违反安全政策的查询,但在面对间接攻击时存在严重漏洞,泄露率平均增加40%以上。即使是推理能力强的模型也未显示出明显优势,且高忠实度的回答往往伴随更多信息泄露。研究团队评估了10种先进模型,发现政策存在与否对防止泄露影响有限,而修订功能仅能部分提升合规性。这揭示了当前AI安全对齐的重大缺陷,强调了开发更强健安全机制的紧迫性。
这项研究分析了混合专家模型(MoE)的"局部路由一致性"特性,即连续词元激活相似专家的程度,这对内存受限设备上的模型部署至关重要。研究者提出了两种测量指标:段路由最佳性能(SRP)和段缓存最佳命中率(SCH),分析了20个不同MoE模型。结果表明,在每层都使用MoE且不含共享专家的模型局部路由一致性最高,领域专业化的专家比词汇专业化的专家对一致性贡献更大。研究还发现,缓存大小为激活专家数量2倍时能取得最佳平衡,为MoE模型设计和部署提供了重要指导。
清华大学研究团队开发的"思维增强型策略优化"(TAPO)通过将外部高级思维模式整合到强化学习中,显著提升了大语言模型的推理能力。这种方法从仅500个样本中抽象出思维模板,在AIME、AMC和Minerva Math等基准测试中分别比传统方法提高了99%、41%和17%的性能,同时增强了模型的可解释性、稳定性和泛化能力,为AI推理研究开辟了新方向。