最新文章
香港中大联合牛津等名校:AI视频已能完美骗过人工智能检测,连顶级模型都认不出真假

香港中大联合牛津等名校:AI视频已能完美骗过人工智能检测,连顶级模型都认不出真假

香港中文大学等顶尖院校联合研究发现,当前最先进的AI视频生成技术已能制作出连顶级检测系统都无法识别的假视频。研究团队开发了Video Reality Test平台,测试结果显示最强生成模型Veo3.1-Fast的假视频仅有12.54%被识别,而最强检测系统Gemini 2.5-Pro准确率仅56%,远低于人类专家的81.25%。研究还发现检测系统过度依赖水印等表面特征,音频信息能提升检测准确性,但技术发展已对信息真实性判断带来严峻挑战。

Google DeepMind让AI画图快了一半,"预览模式"让创作者告别漫长等待

Google DeepMind让AI画图快了一半,"预览模式"让创作者告别漫长等待

Google DeepMind团队提出了革命性的"扩散预览"模式,通过ConsistencySolver技术实现AI图像生成的"预览+精修"工作流程。该技术能在5-10步内生成高质量预览图像,与传统40步完整生成保持高度一致性,用户体验测试显示总体时间节省近50%,大大提高了创作效率和创意探索的自由度。

马里兰大学团队破解AI"探索推理"难题:让机器学会像侦探一样逐步破案

马里兰大学团队破解AI"探索推理"难题:让机器学会像侦探一样逐步破案

马里兰大学研究团队开发了V-REX评估框架,首次系统性地测试AI的探索推理能力。通过将复杂视觉推理分解为问题链,该研究发现AI在跟随既定推理路径方面表现较好,但在自主制定探索策略方面相对薄弱。研究还揭示了模型规模与推理能力的关系,以及引导式推理能够显著提升AI表现的重要发现。

北京大学团队突破机器人学习难题:让机器人从人类视频中学会真正的空间理解能力

北京大学团队突破机器人学习难题:让机器人从人类视频中学会真正的空间理解能力

北京大学团队开发VIPA-VLA模型,通过分析人类操作视频让机器人学会三维空间理解。该方法构建Hand3D数据集,包含30万条空间操作指令,采用双编码器架构和三阶段训练策略。实验显示在仿真环境中成功率达96.8%,真实机器人测试中显著优于传统方法,为机器人技术发展开辟新方向。

机器人终于学会了做家务?NVIDIA团队让AI学会了打理家庭生活的秘诀

机器人终于学会了做家务?NVIDIA团队让AI学会了打理家庭生活的秘诀

NVIDIA研究团队基于π0.5视觉-语言-动作模型开发的家务机器人在2025年BEHAVIOR挑战赛中获得第二名,成功完成50个家务任务中的22个。研究采用递进训练策略,从单任务到50任务预训练,再通过拒绝采样微调技术让机器人在实践中不断改进。该成果展示了通用AI在家庭服务领域的可行性,为未来智能家用机器人的普及奠定了技术基础。

武汉大学推出心理健康AI助手:能像专业咨询师一样思考和判断的语言模型

武汉大学推出心理健康AI助手:能像专业咨询师一样思考和判断的语言模型

武汉大学联合多家机构开发了MentraSuite心理健康AI框架,包含评估平台MentraBench和模型Mindora。该框架能像专业咨询师一样进行系统性推理,在认知评估、诊断、干预策略制定等方面表现出色。通过创新的混合训练方法和一致性检测机制,Mindora在20个模型对比中表现最佳,推理过程更透明可靠,为AI心理健康应用提供了重要突破。

字节跳动惊人发现:最强AI程序员竟然连基本编程任务都搞不定

字节跳动惊人发现:最强AI程序员竟然连基本编程任务都搞不定

字节跳动研究团队通过NL2Repo-Bench平台测试发现,即使是Claude、GPT-5等顶级AI编程助手,在独立完成整个软件项目时成功率也仅有20-40%。研究揭示AI存在过度自信提前停工、无法维持长期架构一致性、依赖管理混乱等根本性缺陷。这项包含104个真实项目的大规模测试表明,AI距离完全自主的软件开发还有很长路要走,为未来AI发展指明了关键改进方向。

阿里巴巴发布QwenLong-L1.5:让AI在百万字文档中像人类专家一样推理

阿里巴巴发布QwenLong-L1.5:让AI在百万字文档中像人类专家一样推理

阿里巴巴通义实验室发布QwenLong-L1.5,首次实现AI在400万字超长文档中进行复杂推理。该研究通过创新的数据合成、强化学习训练和记忆增强架构,让AI获得了类似人类专家的深度分析能力,在长文本推理基准测试中平均提升9.90分,达到GPT-5性能水平,为AI从简单检索向真正理解推理的跨越奠定基础。

快手发布KlingAvatar 2.0:让数字人物活起来的魔法升级

快手发布KlingAvatar 2.0:让数字人物活起来的魔法升级

快手科技发布KlingAvatar 2.0,这是一项革命性的数字人物生成技术。该系统通过协同推理导演和分层制作策略,仅需一张照片、音频和文字描述,就能创造出高质量、长时间的数字人物视频。系统解决了传统技术的时间漂移问题,支持多人控制,在嘴唇同步、表情丰富度和指令执行方面均达到业界领先水平,为数字内容创作和娱乐产业带来重大突破。

人大与蚂蚁集团联手打造文本生成新技术:让AI一边思考一边说话的ReFusion模型

人大与蚂蚁集团联手打造文本生成新技术:让AI一边思考一边说话的ReFusion模型

人大与蚂蚁集团联合推出ReFusion模型,创新性地将文本生成从逐字进行提升到段落级并行处理。该模型采用"规划-填充"双步骤机制,实现了史无前例的键值缓存完全重用,在七项权威测试中相比现有方法平均性能提升34%,速度提高18倍以上,同时在多个任务上超越传统自回归模型,为AI文本生成技术带来重大突破。

南洋理工大学突破线性注意力机制:无误差计算让AI记忆永不衰减

南洋理工大学突破线性注意力机制:无误差计算让AI记忆永不衰减

这是南洋理工大学与复旦大学合作完成的突破性研究,提出了无误差线性注意力(EFLA)技术。该技术通过将线性注意力建模为连续时间动力学系统并推导出精确闭式解,在保持线性计算复杂度的同时完全消除了传统方法中的数值误差累积。实验显示EFLA在处理长序列时具有卓越稳定性,为构建高保真度可扩展序列模型奠定了坚实理论基础。

华盛顿大学发布视频生成新突破:让AI在创作过程中"边想边画"

华盛顿大学发布视频生成新突破:让AI在创作过程中"边想边画"

华盛顿大学与Adobe联合开发的DiffusionBrowser系统实现了AI视频生成过程的实时可视化预览,用户可在生成过程中随时查看包括RGB、深度、法线等多维度信息,并进行交互式调整。该技术将预览生成时间从几分钟缩短至1秒内,同时提供了两种变化生成机制,让用户能够真正参与和引导AI的创作过程,为视频AI从黑盒工具向协作伙伴的转变奠定了基础。

当你家的汽车变成了"四维观察员":香港大学团队如何让AI同时看懂、理解、预测和规划自动驾驶

当你家的汽车变成了"四维观察员":香港大学团队如何让AI同时看懂、理解、预测和规划自动驾驶

香港大学研究团队开发了DrivePI系统,这是首个统一的"四维"自动驾驶AI模型,能同时进行空间理解、三维感知、运动预测和路径规划。该系统仅用5亿参数就在多项测试中超越了现有专业系统,三维感知提升10.3%,碰撞率降低70%,同时具备自然语言交互能力,能实时解释驾驶决策,为自动驾驶的可解释性和实用性带来重大突破。

AI闪耀中国!联想天禧AI亮相吴晓波科技人文秀
2025-12-29

AI闪耀中国!联想天禧AI亮相吴晓波科技人文秀

2月28日,“AI闪耀中国·吴晓波科技人文秀”在厦门圆满落幕,联想天禧个人超级智能体(简称“天禧AI”)作为年度闪耀科技惊艳亮相。

亚马逊全新通用型EC2 M8a实例正式发布

亚马逊全新通用型EC2 M8a实例正式发布

AWS与AMD联合发布Amazon EC2 M8a实例,搭载第五代AMD EPYC处理器,最高频率4.5GHz。相比M7a实例性能提升30%,性价比提升19%。支持最高192个vCPU和768GB内存,网络带宽达75Gbps,EBS带宽60Gbps。适用于Web托管、微服务架构、数据库等通用工作负载,已在美国俄亥俄、俄勒冈和欧洲西班牙区域上线。

IBM推出SAP迁移管理工具应对2027年系统升级截止期

IBM推出SAP迁移管理工具应对2027年系统升级截止期

IBM发布了适用于SAP的IBM咨询应用管理套件,利用生成式和代理AI简化并加速现代化进程。SAP传统ECC系统支持将于2027年结束,但目前仅45%的组织已迁移到新的S/4HANA系统。IBM的工具可创建符合客户标准的特定代码更改,提供主动监控和影响分析。然而分析师指出,迁移工具未能解决核心问题:价值创造,因为客户需要处理多年积累的ECC系统定制化技术债务。

丹麦技术大学首创:用AI给鱼"办身份证",让渔业管理告别盲猜时代

丹麦技术大学首创:用AI给鱼"办身份证",让渔业管理告别盲猜时代

丹麦技术大学研究团队开发出首个商业鱼类重新识别系统,通过AI技术为鱼类配备"电子身份证",解决渔业电子监控中的重复计数难题。研究采用Swin-T视觉变换器,在AutoFish数据集上达到90.43%的识别准确率,显著优于传统CNN方法。技术可实现全自动捕捞记录,为可持续渔业管理提供重要工具。

机器人也能听懂音乐:本田研究院让机器人学会用耳朵预知未来

机器人也能听懂音乐:本田研究院让机器人学会用耳朵预知未来

本田研究院开发出突破性的机器人听觉预测技术,让机器人能够通过分析当前声音预测未来几秒的音频变化。该技术采用流匹配算法,在装水和钢琴演奏实验中表现出色,装水任务达到100%成功率。这项技术将声音从辅助信息提升为核心感知能力,为机器人智能发展开辟了新方向,在制造、医疗、服务等领域具有广阔应用前景。

大语言模型的"思考过程"原来不是在思考:揭秘推理链背后的真实机制

大语言模型的"思考过程"原来不是在思考:揭秘推理链背后的真实机制

这项由巴伊兰大学领导的突破性研究揭示了大语言模型推理过程的真相:看似合理的"思考步骤"实际上是计算状态的存储载体,而非真实思维记录。研究提出"状态载于符号"理论框架,用白板比喻解释AI如何在多个计算周期间传递信息。发现AI可能使用与人类完全不同的编码系统,推理文字的表面含义与实际功能存在根本分离,为AI可解释性研究开辟全新方向。

芬兰大学团队打造语言"体检套装":为芬兰语大模型量身定制的全方位测试系统

芬兰大学团队打造语言"体检套装":为芬兰语大模型量身定制的全方位测试系统

芬兰图尔库大学TurkuNLP团队开发了FIN-bench-v2,这是首个针对芬兰语大模型的综合评估基准系统。该系统通过训练专用测试模型验证评估任务质量,采用四项严格标准筛选可靠测试项目,涵盖阅读理解、常识推理等多个能力维度。研究发现不同模型架构对任务格式敏感性存在显著差异,为小语种AI发展提供了重要参考。