微软在Copilot+ PC发布一年后,推出了Windows AI Foundry取代Windows Copilot Runtime,支持开发者在更广泛的PC设备上部署AI模型。大会还宣布WSL开源、推出高级Windows设置工具,并优化Microsoft Store体验,包括为个人开发者免费注册。微软正从单纯依赖NPU转向CPU、GPU协同加速的策略,致力于构建更完整的AI生态系统,推动Windows平台在AI时代的发展。
上海AI公司MiniMax发布开源推理模型M1,在性能和成本方面挑战DeepSeek、OpenAI等竞争对手。该模型采用Apache许可证真正开源,支持100万token输入和8万token输出,上下文窗口是DeepSeek R1的8倍。MiniMax声称其Lightning Attention机制使M1在处理长上下文推理时仅需DeepSeek R1约30%的算力,大幅降低计算成本。
Instagram正在测试用户转发帖子的功能,该公司周一向TechCrunch确认了这一消息。早在2022年,该社交网络就被发现在开发此功能。部分用户已在账户中看到该功能,可转发自己和他人的内容。虽然平台内容格式已很丰富,但转发功能将允许用户在动态中重新分享帖子,而非仅限于快拍分享。对创作者而言,这有助于提升触达率和可发现性,并确保原创内容获得应有署名。
在IT预算日益紧张的时期,许多CIO试图延长本应淘汰系统的使用寿命。专家建议,如果你在一个勉强获得供应商支持的系统上投资,这可能是系统正在拖垮业务的信号。八个关键迹象包括:频繁故障、可用性下降、信息访问困难、变通方案增多、网络安全担忧加剧、生产力下降、维护成本上升和功能减弱。及早发现这些警示信号有助于制定现代化计划。
哈佛大学研究团队通过创新的多智能体强化学习方法,让AI在战略游戏中学会复杂推理。研究发现AI通过游戏竞争能发展出类人思维能力,在逻辑推理、创造性解决问题等方面表现显著提升。这项突破性成果为未来AI在医疗、教育、城市管理等领域的应用奠定基础,展现了通过模拟人类学习过程培养真正智能AI的新路径。
伊利诺伊大学团队开发的TaxoAdapt框架革新了学术论文自动分类技术,通过多维度分析和自适应扩展机制,能够动态构建反映学术演进趋势的分类体系。该系统在多项指标上显著优于现有方法,成功捕捉了从BERT时代到指令调优时代的学术转变,为学术文献组织和知识发现提供了智能化解决方案。
英国政府发布网络安全增长行动计划,旨在推动年收入达132亿英镑、支撑超6.7万个就业岗位的网络安全产业发展。该计划由布里斯托大学和帝国理工学院牵头,将制定产业发展路线图并提出增长建议。同时提供1600万英镑资金支持网络安全创新,其中1000万英镑用于CyberASAP加速器项目,600万英镑支持初创企业。政府还重组网络安全顾问委员会,邀请亚马逊、谷歌、微软等科技巨头专家参与。
企业需要在每个阶段的每一层都要通过设计实现安全,包含身份与访问管理、监控与事件响应、数据和网络保护、迁移与现代化。因为正是安全这一基础使创新成为可能。
清华大学团队提出首个统一3D点云预训练方法UniPre3D,突破传统方法只能处理特定规模数据的局限。该方法巧妙利用3D高斯喷射技术将3D数据转换为2D图像进行处理,并设计了针对不同数据规模的自适应融合策略。在多个标准数据集上的实验表明,UniPre3D在物体分类、场景分割等任务中均取得显著性能提升,为3D视觉的统一化发展提供了重要突破。
北京邮电大学团队发现大语言模型"遗忘技术"存在重大漏洞:AI在特定训练后虽能拒绝直接问题,但换个问法仍可套出相关信息。研究提出"形式依赖偏差"概念,并开发ROCR概念重定向方法,通过替换AI内部概念表示实现真正遗忘,解决了传统方法的局限性。
这项由多伦多大学等机构联合完成的研究提出了令牌扰动引导(TPG)技术,通过"洗牌"操作改进AI图像生成质量。该方法无需额外训练即可显著提升图像生成效果,在无条件生成中质量指标提升近2倍,条件生成中接近最先进CFG技术的表现。TPG具有即插即用、通用性强的特点,为AI图像生成技术发展提供了新思路。
台湾大学研究团队系统梳理了复合AI系统优化这一新兴领域,提出了基于结构灵活性和学习信号类型的2×2分类框架。研究涵盖26种代表性方法,从固定结构到灵活架构,从自然语言反馈到数值信号优化。团队发现了自然语言反馈在非可微系统优化中的巨大潜力,同时指出了当前面临的人工配置依赖、计算成本过高、评估范围局限等挑战,为这一快速发展的领域提供了系统性理论框架和未来发展指引。
阿里巴巴达摩院联合多家机构构建了史上最大的开源医学推理数据集ReasonMed,包含37万高质量样本。通过多智能体协作和精密质量控制,他们训练出仅70亿参数的ReasonMed-7B模型,在多项医学问答测试中超越了更大规模的竞争对手,甚至在某些测试中击败700亿参数模型,证明了高质量数据胜过模型规模的重要原则。
这项由哈工大深圳与阿里巴巴联合研发的AniMaker系统,能够仅凭文字描述自动制作多角色动画片。系统采用四个AI智能体协作模式,模拟专业动画制作流程,引入蒙特卡洛树搜索算法优化视频片段选择,并首创AniEval动画专用评价体系。实验显示该系统在各项评价指标上均超越现有方法,为AI创意应用开辟新方向。
这项由中国人民大学团队主导的研究提出了VideoDeepResearch框架,颠覆了长视频理解的传统方法。该系统采用文本推理模型配合多模态工具箱的设计,通过智能搜索策略实现对超长视频的精准理解,在多个权威测试中超越GPT-4o等顶级模型,同时显著降低计算成本,为视频AI应用开辟了新路径。
这项由浙江大学、腾讯和新加坡国立大学联合完成的研究,针对中文网络有害内容检测的难题,创建了首个专业标注的中文有害内容检测基准数据集ChineseHarm-Bench,涵盖博彩、色情、谩骂、诈骗、违法广告等六大类别。研究团队提出了知识增强的训练方法,通过结合人工标注规则和大模型隐性知识,让小型模型达到与顶级大模型相当的检测性能,为中文网络环境提供了更高效、更经济的安全检测解决方案。
ByteDance智能创作团队推出CreatiPoster,这是一个革命性的AI海报设计系统,用户只需文字描述就能生成专业级多图层可编辑海报。系统采用"双脑"架构:协议模型负责理解需求并制定详细设计方案,背景模型负责创造匹配的视觉背景。支持多种交互方式,包括纯文字输入、图片素材上传、画布编辑等。在与商业平台的对比评估中表现优异,并开源了10万样本数据集,真正实现了AI设计工具的民主化。
南加州大学研究团队开发了革命性的SAE-Tuning技术,能够像"移植手术"一样将AI推理能力从一个模型转移到另一个模型。该方法将传统推理训练的成本从数千美元降至约1美元,时间从数百小时缩短至20分钟,效果却毫不逊色。更令人惊讶的是,这种推理能力具有跨领域通用性和模块化特性,可以像插件一样即插即用,为AI能力的民主化和模块化发展开辟了新道路。
AI驱动的数字健康初创公司Sword Health以40亿美元估值完成4000万美元融资,较去年30亿美元估值上涨33%。尽管公司现金流为正,CEO表示融资主要用于更新估值和战略收购。公司从虚拟物理治疗师起步,现已扩展至盆底健康和心理健康服务。CEO原计划2025年IPO,但现推迟至2028年,希望在多个医疗垂直领域建立规模化业务后再上市。
法律科技初创公司Crosby刚刚完成由红杉资本领投的580万美元种子轮融资,正式走出隐身模式。该公司不仅为律师开发AI软件,更是一家真正的律师事务所,利用AI技术以前所未有的速度提供法律服务。Crosby主要为初创公司提供合同审查服务,承诺在AI软件和人工监督下,可在一小时内完成新客户合同审查,未来有望缩短至几分钟。公司已为Cursor、Clay等快速成长的初创企业审查了超过1000份客户合同。