以足球之名,致敬热爱与梦想。12月7日,在卡塔尔世界杯如火如荼进行之际,由中国移动携手知名导演陆川打造的世界杯主题短片电影《远征》燃情上线。影片以一场特别的远征,讲述了一对父子踏上追梦之旅、奔赴心之所向的故事,借体育精神传递热爱、希望与坚持,带领众人感受梦想的无限力量。
从激情四射的赛事解说、街头张贴的世界杯海报,到一张“沉甸甸”的世界杯门票,再到座无虚席的卡塔尔世界杯球场,“足球”是贯穿短片电影始终的因素,也指引着球迷父子俩“共赴”远征之路。为了不错过这场期待已久的足球盛会,阿科(柳小海饰)背负着父亲未完成的梦想,怀揣着父子俩对足球共同的热爱,开始了奔赴卡塔尔的旅程。漫漫征途上,他经过白天黑夜,越过山川河流,从东南沿海到雪山高原,跨越长达七千公里的距离,最终来到了卡塔尔世界杯的现场,与全世界不同肤色、不同语言、不同种族的球迷们共享足球狂欢。
“长路漫漫,唯爱与信念支撑我们前行。”此前,《远征》短片电影发布先导片,一幕幕飞驰而过的风景和浓厚的足球氛围,引燃了人们对这场远征的期待;而完整版的正式上线,通过足球的独特魅力与人文意义,唤起了更多人的心理共振。《远征》聚焦世界杯宏大主题下的小人物故事,以足球与电影这两种“通用语言”对话大众,通过温情叙事讲述着超越足球的故事。家庭、父子、中年危机、足球、梦想…..所有的一切凝聚成最真挚的情感,在“远征”中走向诗和远方,传递热爱、希望与坚持的意义。
或许每个人的心底都渴望能有一场说走就走的征途。作为卡塔尔世界杯足球赛的持权转播商,中国移动此次与导演陆川携手打造短片电影《远征》,希望为现实生活感到困顿和压抑的人们,带来坚持梦想、为爱奔跑的力量,告诉大家,在平庸的生活中,我们依然有着最真挚的热爱和坚定,足以跨越山海。
好文章,需要你的鼓励
这项由阿伯丁大学和格勒诺布尔阿尔卑斯大学研究者联合完成的研究揭示了大语言模型处理日期时的关键问题:现代分词器常将日期分割成无意义的碎片,如"20250312"被切分为"202"、"503"、"12",这严重影响时间推理能力。研究提出了日期碎片化率指标,创建了DATEAUGBENCH测试集,并通过内部机制分析发现,大型模型能在早期层快速"修复"碎片化日期,但其推理路径与人类理解方式显著不同,这解释了模型在处理非标准日期时的准确率下降。
MUG-Eval是KAIST和Trillion Labs联合开发的创新多语言评估框架,通过让语言模型在目标语言中进行自我对话来评估其生成能力。该方法独特之处在于不依赖语言特定工具或人工标注数据,而是通过任务完成率间接衡量语言能力。研究团队测试了8种顶级语言模型在30种语言上的表现,发现其结果与传统评估方法高度一致(相关系数>0.75)。MUG-Eval揭示了模型在低资源语言上表现显著落后,并发现英语并非评估低资源语言的最佳替代。该框架理论上支持2,102种语言,为真正包容的AI评估提供了新途径。
浙江大学研究团队开发的"自制动力训练"(Self-Braking Tuning,SBT)方法解决了大型语言模型在推理过程中的过度思考问题。该方法不依赖外部干预,而是培养模型自主识别冗余推理并适时终止的能力。研究者通过分析推理效率比率和过度思考标记比率,构建了两种数据策略:SBT-E(精确版)和SBT-D(动态版)。实验结果表明,经过训练的模型在多个数学基准测试上保持原有准确率的同时,将标记消耗减少了30%到60%,显著提高了推理效率。这项创新使AI系统能更像人类一样有效思考,为资源受限环境下的AI部署提供了新解决方案。
上海交通大学AI团队提出的SpatialScore是迄今最全面的多模态空间理解评测基准,包含28K样本,涵盖各类空间任务。研究首创VGBench专门评估视觉几何感知能力,并开发SpatialAgent多代理系统,集成9种专业工具增强空间理解。实验表明,即使最先进的大模型在空间理解方面仍存显著局限,特别是在视觉几何感知任务上,而SpatialAgent通过结构化工具调用显著提升性能。这项工作为未来多模态模型在实体AI应用中的发展提供关键方向,填补了AI系统在3D空间认知能力评估的重要空白。