最新文章
2025-11-20

PTC深化与Garrett Motion的合作关系,加速新产品开发转型

PTC(纳斯达克股票代码:PTC)今日宣布将扩大与Garrett Motion的合作关系。

火山引擎领跑Gartner全球AI应用开发平台「挑战者」象限
2025-11-20

火山引擎领跑Gartner全球AI应用开发平台「挑战者」象限

日前,Gartner(R)发布2025年度全球《AI应用开发平台魔力象限》:凭借豆包大模型和火山方舟大模型服务平台 ,火山引擎领跑全球挑战者象限,在中国厂商中位居第一。

Meta研究团队发布超大规模视觉推理数据配方:让AI像人类一样"看图解题"的秘密

Meta研究团队发布超大规模视觉推理数据配方:让AI像人类一样"看图解题"的秘密

Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。

多模态AI的"减肥革命":上海AI实验室让视觉模型效率翻倍的神奇方法

多模态AI的"减肥革命":上海AI实验室让视觉模型效率翻倍的神奇方法

上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。

上海AI实验室团队首创科学实验视频理解基准:让AI读懂真实实验室里发生的一切

上海AI实验室团队首创科学实验视频理解基准:让AI读懂真实实验室里发生的一切

上海AI实验室团队开发出首个科学实验视频理解基准ExpVid,通过三层评估体系全面测试AI对真实实验室操作的理解能力。测试19个主流AI模型发现,虽然AI在基础识别上超越人类,但在复杂科学推理方面仍有巨大提升空间,为未来AI科研助手的发展指明方向。

北京交通大学团队突破:让AI学会自己管理记忆,小模型也能干大事

北京交通大学团队突破:让AI学会自己管理记忆,小模型也能干大事

这项由北京交通大学等机构联合完成的研究首次将记忆管理作为AI的内在学习能力,而非外部工具。MemAct框架让AI主动编辑工作记忆,配合新开发的DCPO训练算法解决了记忆编辑带来的技术挑战。实验证明,较小的MemAct模型能以更少资源超越大型传统模型,不同规模模型还会自然演化出适应性策略,为AI效率提升开辟了新路径。

阿里巴巴团队突破:让AI直接在像素世界"画图",告别中间商赚差价

阿里巴巴团队突破:让AI直接在像素世界"画图",告别中间商赚差价

这项由阿里巴巴AMAP团队联合英伟达和加州理工完成的研究,成功实现了AI直接在像素空间生成高质量图像,无需依赖VAE编码器这个"中间商"。通过创新的两阶段训练框架,EPG模型在ImageNet-256上达到2.04的FID分数,仅需75次函数评估,性能媲美主流VAE方法但效率更高。研究还首次成功训练出像素空间一致性模型,实现8.82 FID的单步生成效果,为AI图像生成技术开辟了新的发展道路。

Inria巴黎团队发现:让AI"思考"反而影响翻译质量的惊人真相

Inria巴黎团队发现:让AI"思考"反而影响翻译质量的惊人真相

法国Inria巴黎研究所团队通过大规模实验发现,让AI模型"思考"后翻译反而会降低翻译质量。研究覆盖十种语言方向,证明与数学编程等逻辑任务不同,翻译需要语言间直觉转换而非步骤推理。研究还发现提升训练数据质量比教会模型复杂推理更有效,为AI翻译技术发展提供重要启示。

谷歌Scholar Labs使用AI搜索科学研究论文

谷歌Scholar Labs使用AI搜索科学研究论文

谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。

当AI学会"避开套路":Adobe研究院如何让机器生成真正有创意的图片

当AI学会"避开套路":Adobe研究院如何让机器生成真正有创意的图片

Adobe研究院联合以色列理工学院和特拉维夫大学提出了VLM引导的自适应负向提示方法,通过在AI图像生成过程中实时识别并排除常见模式,成功解决了现有AI模型只能生成典型化内容的问题。该方法让AI在约束中探索真正的创意空间,生成的创意宠物中87%属于未知类别,同时保持了物体的功能有效性,为AI创意生成开辟了新路径。

戴尔科技与Microsoft携手创新,定义企业IT新未来
2025-11-20

戴尔科技与Microsoft携手创新,定义企业IT新未来

戴尔科技发布了多项与Microsoft的最新合作成果

Meta发布第三代SAM视觉AI模型,助力野生动物保护研究

Meta发布第三代SAM视觉AI模型,助力野生动物保护研究

Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。

OpenAI推出免费ChatGPT教师版,提供GPT-5.1无限使用至2027年

OpenAI推出免费ChatGPT教师版,提供GPT-5.1无限使用至2027年

OpenAI发布了ChatGPT教师版,专门面向K-12学校教职员工,免费使用至2027年6月。该版本包含GPT-5.1 Auto无限消息功能,支持文件上传、图像生成等特性,同时符合《家庭教育权利法》要求。教师可用其创建教学材料,分享聊天记录,并获得其他教师使用建议。此前OpenAI已推出面向学生的ChatGPT Edu和学习模式功能。

驯服数据混乱:为企业构建AI就绪的数据平台

驯服数据混乱:为企业构建AI就绪的数据平台

企业AI已达到关键转折点,但大多数项目在产生价值前就停滞了。数据科学家需要使用7-15个工具来处理数据,仍需数月才能获得可用状态。IDC研究显示,不到44%的AI试点项目能投入生产。问题不在于算力或模型架构,而是无法在碎片化异构环境中实现数据管道的运营化。Hammerspace AI数据平台通过统一数据命名空间和自动化数据编排,解决了企业数据孤岛问题,为AI工作负载提供高性能统一数据平面。

欧盟拟放松AI和隐私法律监管政策

欧盟拟放松AI和隐私法律监管政策

欧盟委员会提出全面修改科技监管政策的提案,旨在减少大型科技公司面临的监管障碍。修改内容包括:允许AI公司访问共享个人数据进行模型训练、简化小企业审批流程、将AI监管集中至AI办公室、推迟高风险AI应用的严格规定实施。此外,备受诟病的Cookie横幅将被重新设计,减少弹出频率并支持一键同意。该提案现已提交欧洲议会审批,可能面临质疑声音。

苹果公司首次推出能搜网页的多模态AI:DeepMMSearch-R1让AI既能看图又能上网查资料

苹果公司首次推出能搜网页的多模态AI:DeepMMSearch-R1让AI既能看图又能上网查资料

这项由苹果公司和约翰斯·霍普金斯大学联合开展的研究开发出了首个能够进行多模态网络搜索的AI系统DeepMMSearch-R1。该系统突破性地实现了动态搜索决策、图片裁剪搜索和自我纠错能力,在多个测试数据集上的表现接近甚至达到了GPT-o3的水平,为AI助手的实用化发展开辟了新方向。

ByteDance抖音SAIL团队携手港中文发布全模态嵌入模型:SAIL-Embedding如何让机器真正"看懂"短视频世界

ByteDance抖音SAIL团队携手港中文发布全模态嵌入模型:SAIL-Embedding如何让机器真正"看懂"短视频世界

ByteDance抖音SAIL团队与港中文合作发布SAIL-Embedding全模态嵌入模型,能同时理解视频、文字、音频三种信息。该模型在抖音推荐系统中实现显著性能提升,7天生命周期增长0.158%,通过创新的动态负样本挖掘、自适应数据平衡等技术突破了传统多模态模型的限制,为短视频内容理解和推荐提供了新的解决方案。

伊利诺伊大学团队首创化学反应机制推理基准:让AI像化学家一样"思考"反应过程

伊利诺伊大学团队首创化学反应机制推理基准:让AI像化学家一样"思考"反应过程

伊利诺伊大学团队构建了全球首个大规模有机化学反应机制推理基准oMeBench,包含超过1万个专家标注的反应步骤,并开发了动态评估系统oMeS。研究发现目前最好的AI模型准确率仅约38%,但通过示例学习和专门训练可显著提升性能,小模型经训练后性能提升50%。该研究为AI化学推理能力评估和改进提供了重要工具和方法。

港科大团队打造"蜂群智能":让一群普通AI合力超越顶级AI大模型

港科大团队打造"蜂群智能":让一群普通AI合力超越顶级AI大模型

香港科技大学等高校联合开发了SwarmSys系统,让多个普通AI智能体像蜜蜂一样协作,通过探索者、工作者、验证者三种角色的分工配合,实现了群体智慧效应。实验显示,8个GPT-4o智能体的协作表现在某些任务上接近GPT-5水平,证明了通过精巧协作设计可以获得超越单体模型的智能表现,为AI发展提供了新思路。

亚马逊与伊利诺伊大学联手研究:让AI助手学会遵守复杂规则的新方法

亚马逊与伊利诺伊大学联手研究:让AI助手学会遵守复杂规则的新方法

这项由伊利诺伊大学厄巴纳-香槟分校与亚马逊联合开展的研究,提出了一种名为"多模态策略内化"的创新技术,让AI助手能够将复杂的工作规则"牢记在心"而无需每次查阅。通过三阶段训练方法,AI助手的准确率提高了70.7%,处理效率提升了85.7%,同时保持了良好的通用智能水平。该技术为构建更智能、更高效的AI工作伙伴奠定了重要基础。