最新文章
香港大学联合Adobe研究突破:让AI既能看懂图片又能生成美图的"万能大脑"

香港大学联合Adobe研究突破:让AI既能看懂图片又能生成美图的"万能大脑"

香港大学联合Adobe研究院提出PS-VAE技术,成功解决了AI无法同时具备图像理解和生成能力的难题。通过创新的两阶段训练策略,让AI既能准确理解图片语义,又能生成高质量图像,在图像编辑任务上性能提升近4倍,为统一视觉AI系统开辟新路径,在数字创作、教育、电商等领域具有广阔应用前景。

华中科技大学与马里兰大学联合发现:AI评判员可能比想象中更不靠谱

华中科技大学与马里兰大学联合发现:AI评判员可能比想象中更不靠谱

华中科技大学与马里兰大学研究团队开发出Sage评估框架,首次无需人工标注即可评估AI评判员可靠性。研究发现即使最先进的AI模型在评判任务中也存在严重不一致问题,近四分之一困难情况下无法保持稳定偏好。团队提出明确评判标准和专门微调等改进方法,为构建更可靠AI评估体系提供重要工具。

软件工程基准测试迎来自动化革命:图灵公司如何让AI编程评测变得更聪明更全面

软件工程基准测试迎来自动化革命:图灵公司如何让AI编程评测变得更聪明更全面

图灵公司研究团队开发的SWE-Bench++是一个革命性的AI编程能力测评框架,能够从GitHub开源项目中自动生成大规模、多语言的编程测试题目。该系统通过四阶段流水线处理,从3,971个项目中生成了11,133个测试实例,覆盖11种编程语言,相比传统方法规模提升数百倍。更重要的是,它能将困难测试转化为高质量训练数据,显著提升AI编程能力。

香港科大团队突破AI视觉盲区:让机器在模糊世界中依然"看"得清楚

香港科大团队突破AI视觉盲区:让机器在模糊世界中依然"看"得清楚

香港科技大学团队开发出Robust-R1框架,让AI在处理模糊、噪声等退化图像时不再"瞎猜"。该系统像侦探破案一样,先识别图像问题类型和严重程度,分析其对理解的影响,然后制定针对性的推理策略。通过三阶段训练和11K真实退化样本,Robust-R1在多个基准测试中显著超越传统方法,不仅提升了准确性还增强了可解释性,为AI在恶劣环境中的可靠应用奠定了基础。

清华大学团队破解图像生成的"速度魔咒":让AI画图快三倍的聪明策略

清华大学团队破解图像生成的"速度魔咒":让AI画图快三倍的聪明策略

清华大学团队开发的StageVAR技术通过分析AI图像生成的三个阶段特性,创新性地采用阶段感知加速策略,在第三阶段利用语义无关性和低秩特征压缩技术,实现了3.4倍速度提升而质量几乎无损。这项即插即用的技术为AI图像生成效率优化提供了全新思路。

本古里安大学研究团队推出HERBench:让AI视频理解不再只看一眼就猜答案

本古里安大学研究团队推出HERBench:让AI视频理解不再只看一眼就猜答案

本古里安大学研究团队推出HERBench视频理解评估基准,发现当前最先进AI模型在需要整合多个时间段信息的视频理解任务上表现远低于预期。该研究创新性地提出"最小必需帧集"概念,设计了需要至少三帧信息才能解答的26806道题目,揭示了AI视频理解的帧选择和信息融合两大核心瓶颈。

机器学习的"瘦身"革命:英国研究团队如何让AI模型既聪明又节能

机器学习的"瘦身"革命:英国研究团队如何让AI模型既聪明又节能

英国研究团队开发了ModernALBERT模型,通过创新的"混合低秩专家"(MoL)技术,成功解决了AI模型参数共享导致的性能损失问题。该技术让小型模型在多项权威测试中超越了更大的传统模型,同时配套的专家融合策略实现了高效部署。这项研究为资源受限环境下的高质量AI应用开辟了新路径。

高性能 AI 边缘推理服务器MIC-743-AT
2025-12-23

高性能 AI 边缘推理服务器MIC-743-AT

技术引领奖超级终端

Instagram长视频内容和个性化订阅可能即将到来

Instagram长视频内容和个性化订阅可能即将到来

Instagram负责人莫塞里在接受采访时透露,平台正考虑引入长视频内容功能,尽管此前一直专注于短视频。他承认为了吸引优质内容,Instagram可能需要支持长视频格式。此外,Meta最近推出了"您的算法"功能,旨在让用户更好地控制信息流内容。莫塞里承诺未来将提供更多工具,让用户主动塑造个性化内容,但完整实现可能需要2-4年时间。

NVIDIA DGX Spark
2025-12-23

NVIDIA DGX Spark

超级终端奖

Dell Pro Max with GB10
2025-12-23

Dell Pro Max with GB10

超级终端奖

至顶AI实验室硬核评测:戴尔 Precision 5490移动工作站搭建Open Deep Research,打造专属于你的全流程AI研究助手
2025-12-23

至顶AI实验室硬核评测:戴尔 Precision 5490移动工作站搭建Open Deep Research,打造专属于你的全流程AI研究助手

在信息爆炸的时代,AI实验室的研究员们常常需要面对海量的论文、专利文件、论坛发言等各种渠道的信息。传统的查找方式不仅费时费力,还容易遗漏关键内容。那么,有没有一种方式能让AI真正代替人工,完成从找资料到写出稿的全流程工作?

至顶AI实验室硬核评测:夸克 AI 眼镜全链路"无切换体验",当AI助手真正走进日常
2025-12-23

至顶AI实验室硬核评测:夸克 AI 眼镜全链路"无切换体验",当AI助手真正走进日常

当我们还在讨论AI能否真正融入生活时,有些产品已经悄然给出了答案。

夸克AI眼镜
2025-12-23

夸克AI眼镜

技术引领奖超级终端

至顶AI实验室硬核评测:据说这就是AI手机的形态,贴脸开大,豆包手机上手评测
2025-12-23

至顶AI实验室硬核评测:据说这就是AI手机的形态,贴脸开大,豆包手机上手评测

“3499元的豆包手机能做的事,现在你的安卓机也能免费玩了。”

OpenFlex(TM) Data24 NVMe-oF(TM) 存储平台
2025-12-23

OpenFlex(TM) Data24 NVMe-oF(TM) 存储平台

技术引领奖技术引擎

英特尔(R) 至强(R) 6776P处理器
2025-12-23

英特尔(R) 至强(R) 6776P处理器

技术引领奖技术引擎

通用服务器Dell PowerEdge
2025-12-23

通用服务器Dell PowerEdge

技术引领奖技术引擎