这篇文章,我们结合团结引擎的进化,与左瑞文的采访,以及与开发者的交流,来具体聊聊Unity中国与团结引擎如何通过一系列本土化的技术抉择和战略布局,回应这些来自中国开发者的真实需求。
如果现在你跟智驾从业者深聊,会发现一个微妙变化:几年前,大家还在为传感器的配置、特定场景的覆盖率等讨论不停;而今天,话题焦点又多了一个更具体的型结构--VLA。
阿卡迈技术公司宣布发布新一期的《互联网现状》(SOTI) 报告——《2025 年数字欺诈与滥用报告》。
中科大研究团队构建了史上最全面的U-Net评测平台U-Bench,对100种医学图像分割模型进行了严格比较。研究发现大多数改进版模型在统计学上并无显著提升,传统准确率指标已现天花板效应,而新提出的U-Score指标更好地平衡了准确率与效率。该研究揭示了医学AI领域从追求纯准确率向注重实用性的重要转变。
近日,全球创新、开源和安全企业级解决方案领导者SUSE (R)宣布推出SUSE Linux Enterprise Server (SLES) 16。
以 “共筑开放合作、安全普惠的数智未来” 为主题的 2025 年世界互联网大会乌镇峰会正式启幕。SAP亮相乌镇,其《SAP 商业 AI:重构企业管理,赋能 “确定性” 增长》实践案例,凭借在AI和企业数字化转型上的卓越成效,再度斩获 “携手构建网络空间命运共同体精品案例” 殊荣。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。
加州大学圣地亚哥分校研究团队发现,广泛使用的AI评估基准存在严重的时间错位问题。在五个主要基准中,24%-64%的时间敏感问题答案已过时,导致掌握最新知识的先进AI模型反而在测试中被误判。这一发现揭示了AI评估体系的可信度危机,对数千项相关研究产生潜在影响,呼吁建立动态更新的评估机制。
北京大学联合多所知名高校突破机器人视角转换难题,开发出WristWorld技术,首次实现仅通过外部摄像头画面自动生成手腕视角操作视频。该技术采用两阶段设计——空间重建与视频生成,通过创新的空间投影一致性损失实现高质量视角转换。实验显示生成视频质量比现有方法提升4-5倍,机器人操作成功率提升15%以上,有望大幅降低机器人训练成本并推动精密操作应用。
这项由斯坦福大学和乔治亚理工学院联合开展的研究开发了MLE-Smith系统,能够自动将原始数据集转换为高质量的机器学习竞赛题目。该系统通过三个智能代理协同工作,建立了严格的三重质量检验体系,已成功生成606个验证通过的竞赛项目。实验证明其生成的题目质量与专家制作的完全等价,平均制作时间仅7分钟,成本0.78美元,为人工智能训练提供了可扩展的自动化基础设施。
斯坦福大学等顶尖研究机构联合开发的TTRV技术首次实现AI"边学边考",让人工智能在处理视觉问题时能够实时自我学习和改进。该技术通过分析AI多次回答的分布模式来提取奖励信号,结合频率分析和思维集中度控制,无需外部标注数据就能显著提升模型性能,在图像识别中最高提升52.4%,甚至让开源模型超越GPT-4o。
这篇论文系统梳理了文本到视频生成技术从2018年至2025年的完整发展历程,分析了从早期GAN模型、VAE方法到最新扩散模型的技术演进。研究详细比较了各代表性模型的架构特点、训练配置和性能表现,探讨了数据集建设、评估方法等关键问题,并识别了当前面临的主要挑战。论文为这个快速发展的AI领域提供了迄今最全面的技术图谱,为未来研究方向提供了重要指导。
香港浸会大学研究团队开发的AlphaApollo系统,让多个AI模型像阿波罗登月团队一样协作推理。系统为AI配备Python计算工具和文档检索工具,解决了传统AI无法精确计算和独自推理的局限。在数学竞赛测试中,该系统将AI表现大幅提升,部分模型通过率翻倍。这种协作式AI代表了新的发展方向,未来有望带来更可靠智能的AI助手。
上海交大团队开发的G?RPO技术通过"单步随机采样"和"多粒度优势集成"两大创新,解决了AI绘画训练中奖励信号稀疏和评估不全面的问题。该技术在Flux.1-dev模型上实现了6.52%的性能提升,不仅改善了图像质量和文本遵循性,还提高了训练效率。这项突破为AI更好理解人类审美偏好提供了新路径。
这项由IIT甘地那加大学领导的研究是迄今最全面的语码转换(多语言混杂)研究报告,分析了308项研究、80多种语言。研究发现现有AI在处理混杂语言时错误率高达30-50%,但新兴的专门模型如HingBERT、COMMIT等已实现重大突破。未来AI将更好理解人类自然的多语言表达方式,让智能设备、翻译系统、社交媒体等变得更加人性化和包容。
清华大学团队开发出D3QE系统,专门检测自回归AI模型生成的假图片。该系统通过分析AI模型的"用色习惯"和量化误差,在多种测试中达到82-97%的检测准确率。研究构建了包含7种主流自回归模型的ARForensics数据集,为AI图片检测领域提供了新的解决方案和研究基础。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。