最新文章
AI意识的音乐图灵测试:让AI点一首"最爱的歌"

AI意识的音乐图灵测试:让AI点一首"最爱的歌"

理查德·道金斯教授或许可以用一个问题来测试AI是否有意识:让它说出最好的歌曲。AI会给出销量最高或获奖最多的客观答案,而有意识的人类会说出自己最喜欢的歌,或某个特殊时刻的背景音乐。此外,有用户测试AI助手Claude时发现,它不仅能准确提供酒吧信息,还声称"对该地区很熟悉",这种虚构经历的回答引发了对AI可信度的质疑。

香港中文大学、新加坡管理大学与哥伦比亚大学联手:让AI写出来的网站真正"能用",而不只是"能跑"

香港中文大学、新加坡管理大学与哥伦比亚大学联手:让AI写出来的网站真正"能用",而不只是"能跑"

这篇研究提出TDDev框架,通过自动生成测试、浏览器模拟验证和失败报告转化,将AI生成网站的功能准确率提升34-48个百分点,并将开发者手动干预降为零。

香港理工大学出手:把多个AI专家"合并"再"压缩",效果不降反升?

香港理工大学出手:把多个AI专家"合并"再"压缩",效果不降反升?

香港理工大学提出E-PMQ,将多专家模型合并后量化时引入源专家引导校准,并加入合并权重锚定,有效缓解合并偏差与量化偏差叠加问题,大幅提升低比特部署效果。

MemTensor团队打造的"技能管家":让AI智能体拥有可进化的经验库,性能提升高达7.9%

MemTensor团队打造的"技能管家":让AI智能体拥有可进化的经验库,性能提升高达7.9%

SkillsVote是MemTensor团队提出的AI技能生命周期管理框架,通过百万级技能库筛选、智能推荐与执行归因,让AI助手无需重新训练就能持续积累经验,在多个基准测试上性能提升最高7.9%。

波兰国家研究院揭秘AI推理"内心独白":通过隐藏轨迹预测大模型真实意图

波兰国家研究院揭秘AI推理"内心独白":通过隐藏轨迹预测大模型真实意图

波兰国家研究院提出通过追踪大型推理模型内部激活状态的动态变化来预测其行为意图,即使推理文字不忠实,探针轨迹仍能达到95%预测准确率。

F5 Solution Day 2026隆重召开,三大创新赋能Token经济发展
2026-05-25

F5 Solution Day 2026隆重召开,三大创新赋能Token经济发展

F5集中展示了全面进化的应用交付与安全平台(ADSP)、本地化的基于词元(Token)的负载均衡解决方案(TBLB)

厦门大学团队研发出一套能自动"出题考AI"的系统,结果发现最强大模型的得分竟不到四成

厦门大学团队研发出一套能自动"出题考AI"的系统,结果发现最强大模型的得分竟不到四成

厦门大学团队开发A?RBench系统,让AI自动出题、验证并考察其他AI的抽象推理能力,发现最强模型得分仅39.8%,远低于人类的68.5%。

阿联酋人工智能大学联手密歇根州立大学:让图像生成AI学会"自我审查"的新方法

阿联酋人工智能大学联手密歇根州立大学:让图像生成AI学会"自我审查"的新方法

阿联酋MBZUAI与密歇根州立大学提出SafeDiffusion-R1,通过在线强化学习与CLIP几何引导奖励,无需配对数据即可让图像生成AI大幅减少有害输出,同时提升构图能力。

多伦多大学与谷歌联手破解"AI看3D"的速度瓶颈:像侦探挑线索一样,让视觉几何模型跑得更快

多伦多大学与谷歌联手破解"AI看3D"的速度瓶颈:像侦探挑线索一样,让视觉几何模型跑得更快

这项来自多伦多大学与谷歌的研究提出GoToHunt方法,通过两级token筛选策略将视觉几何变换器的推理速度提升超过85%,且无需重新训练模型,在多项三维重建任务上性能持平甚至超过原始模型。

卡内基梅隆大学等机构联合提出:让AI在"温故"中"知新",解决大模型学习新知识就忘旧本领的难题

卡内基梅隆大学等机构联合提出:让AI在"温故"中"知新",解决大模型学习新知识就忘旧本领的难题

MIXSD通过将新知识与模型自身语言习惯混合来构建训练数据,在语言模型学习新知识时有效缓解灾难性遗忘,让AI记住新知的同时保留原有能力。

华宝新能便携储能加码越南产能,本地化交付进入排产阶段

华宝新能便携储能加码越南产能,本地化交付进入排产阶段

今天讲的出海案例是华宝新能,一家做便携储能和家庭绿电产品的公司,把越南产能放进全球交付体系,并把马来西亚、越南产能释放纳入投资者追问。

NVIDIA研究团队打造全球首个FP4视频生成系统,速度提升两倍还省一半内存

NVIDIA提出LongLive-2.0,首个覆盖训练和推理全流程的NVFP4长视频生成系统,速度提升2.15倍,内存减少45%,5B模型实现45.7 FPS实时生成。

字节跳动推出Lance:一个能同时"看懂"和"画出"图片与视频的多功能AI模型

字节跳动推出Lance:一个能同时"看懂"和"画出"图片与视频的多功能AI模型

字节跳动推出Lance,一个30亿参数的轻量级统一多模态模型,可在单一框架内同时完成图像视频的理解、生成与编辑,并通过多任务协同训练实现跨任务性能互促。

Blockchain.com秘密提交美国IPO申请,加密货币上市热潮持续升温

Blockchain.com秘密提交美国IPO申请,加密货币上市热潮持续升温

英国加密货币交易所及钱包服务商Blockchain.com宣布已秘密向美国SEC提交IPO申请,具体发行细节尚未披露。该公司成立于2011年,目前拥有逾9500万个钱包,平台交易量超1.1万亿美元,覆盖20余款产品。此次IPO跟随Circle、Gemini等加密巨头上市步伐,但加密行业IPO进程并非一帆风顺,Kraken等公司已因市场波动暂停上市计划。

Stellantis与高通扩展合作,共推AI驱动车载平台

Stellantis与高通扩展合作,共推AI驱动车载平台

Stellantis与高通科技宣布扩大多年技术合作,将采用高通骁龙数字底盘系统级芯片为下一代车型提供动力。合作将骁龙数字底盘方案与Stellantis的STLA Brain电子软件平台深度整合,提升座舱、网联和高级驾驶辅助系统性能。协议还包括骁龙Ride Pilot ADAS平台,可从主动安全扩展至L2+级别自动驾驶,覆盖数百万辆Stellantis车辆。

Plus One Robotics完成八小时仓库自动化系统直播演示

Plus One Robotics完成八小时仓库自动化系统直播演示

仓库自动化公司Plus One Robotics完成了一场八小时的AI驱动包裹分拣系统直播演示,展示大规模仓库机器人实际运营状况。系统在八小时内完成19784次抓取,每小时处理2488件包裹,平均每件用时1.45秒,超过950名观众观看。此举旨在提供比常见短视频更真实的自动化系统持续运行表现,反映行业向可衡量运营透明度转变的趋势。

比亚迪旗舰电动轿车"大汉"路试谍照曝光,即将发布

比亚迪旗舰电动轿车"大汉"路试谍照曝光,即将发布

比亚迪大汉电动轿车即将亮相,作为旗舰SUV大唐的姊妹车型。新车将搭载第二代刀片电池和闪充技术,续航里程可达1000公里,5分钟即可完成快速充电。谍照显示其采用与大唐相似的设计语言,配备贯穿式LED灯带。预计8月开启预售,9月正式上市,售价或略低于大唐的25万元起售价。

Lucid平价中型SUV Cosmos原型车现身,与特斯拉Model Y同框比较

Lucid平价中型SUV Cosmos原型车现身,与特斯拉Model Y同框比较

Lucid Cosmos原型车在亚利桑那州工厂附近路测时被拍到,与特斯拉Model Y停在一起,两车尺寸相近。这款中型SUV起售价低于5万美元,搭载69kWh电池可实现300英里续航,能效达4.5英里/kWh,0-60英里加速3.5秒。新车计划今年夏季正式发布,2026年底投产,将直接对标Model Y市场。

Google Pixel 新增"Disco"自定义图标包,风格独树一帜

Google Pixel 新增"Disco"自定义图标包,风格独树一帜

谷歌Pixel手机推出全新"迪斯科"图标包,为应用图标赋予迪斯科球效果。该设计灵感源自社交媒体上的"discomorphism"风格讨论。新图标包采用黑色背景配合镜面球效果,与此前推出的"涂鸦""饼干""星尘"等AI生成图标风格一同提供个性化选择,支持不同色彩方案定制。

安卓应用周五优惠合集:Balatro、Samorost 3等精选游戏限时折扣

安卓应用周五优惠合集:Balatro、Samorost 3等精选游戏限时折扣

本周五安卓平台推出多款应用和游戏优惠,包括Balatro、Samurai of Hyuga 5、Samorost 3、CHUCHEL、Botanicula、Dawncaster等热门游戏。同时硬件方面也有优惠活动,Galaxy Fold 7最高优惠819美元,微信Surface Laptop 7降价577美元,LG 77英寸B5 OLED电视降价1500美元并赠送200美元礼品卡。