人工智能 关键字列表
新型15亿参数路由模型实现93%准确率,无需昂贵重训练

新型15亿参数路由模型实现93%准确率,无需昂贵重训练

Katanemo Labs研究人员推出Arch-Router,一个智能路由模型框架,可将用户查询映射到最合适的大语言模型。该框架采用"偏好对齐路由"方法,允许用户用自然语言定义路由策略,通过域-动作分类法组织任务。Arch-Router是15亿参数模型,在四个公开数据集上达到93.17%的路由准确率,超越顶级专有模型平均7.71%。系统支持实时策略调整,无需重新训练,为企业多模型部署提供灵活解决方案。

Cloudian将Milvus向量数据库集成到HyperStore中用于AI推理

Cloudian将Milvus向量数据库集成到HyperStore中用于AI推理

对象存储供应商Cloudian正在将Milvus向量数据库功能集成到其HyperStore软件中,作为AI数据平台路线图的一部分提供AI推理能力。HyperStore是一个对象存储系统,具有几乎无限的可扩展性并支持Nvidia的GPUDirect。向量数据库存储非结构化文档数据的多维方面的数学变换,以及向量化的音频、图像和视频数据。这些向量被大型语言模型用于在构建对用户请求的响应时搜索语义相关的向量。

Deepgram推出Saga:为开发者打造的AI语音接口

Deepgram推出Saga:为开发者打造的AI语音接口

Deepgram发布了名为Saga的AI语音操作系统,专为开发者设计。该工具作为通用语音界面直接嵌入开发环境,允许开发者仅通过语音控制工具和代码。Saga集成了多种AI原生编码环境,包括Cursor和Windsurf,还可维护Linear、Asana、Jira等项目管理软件的状态更新。开发者可通过语音表达想法,如"创建一个响应表情符号的Slack机器人",Saga会将其转换为可执行的编程提示。该工具旨在减少开发者在工具间切换的"静默税收",提高开发效率。

Graphwise升级图数据库成为AI智能体的大脑

Graphwise升级图数据库成为AI智能体的大脑

保加利亚图数据库初创公司Graphwise发布GraphDB 11重大升级,新增功能旨在增强企业知识管理并为人工智能模型提供更可靠的基础。该平台通过语义层管理结构化和非结构化数据,支持更多大语言模型包括Llama、Gemini等,并新增模型上下文协议支持。GraphDB 11还改进了精确实体链接功能,优化了数据检索和AI输出应用。公司表示新版本可帮助解决AI就绪数据不足问题,降低基础设施成本,提高AI项目成功率。

三星收购Xealth加速数字健康平台布局

三星收购Xealth加速数字健康平台布局

韩国电子巨头三星宣布收购美国西雅图数字健康技术公司Xealth,进一步扩大在健康领域的布局。Xealth专注于帮助医疗专业人员将数字健康技术整合到日常实践中,与70多家数字健康技术供应商合作,应用覆盖美国500多家医院。此次收购将推动三星向连接医疗保健平台转型,结合其在传感器技术和可穿戴设备方面的优势,完善Samsung Health平台功能。

企业AI应用最佳实践指南

企业AI应用最佳实践指南

当前企业面临引入AI的机遇与挑战。管理层需要了解机器学习算法基础,包括线性回归、神经网络等核心技术。专家建议从小规模试点开始,优先选择高影响用例,投资数据治理,提升员工技能。对于影子IT现象,应将其视为机会而非问题,建立治理流程将有效工具正式化。成功的AI采用需要明确目标、跨部门协作、变革管理和持续学习社区建设。

车队未来:AI预测性维护预防故障

车队未来:AI预测性维护预防故障

美国垃圾收集行业2024年创收690亿美元,近18万辆垃圾车每周运营六至七天,每日停靠超千次。设备故障成为行业最大隐性成本,每辆车年均故障费用超5000美元。AI技术通过实时监控传感器数据,能提前数周预测故障,优化零部件库存管理,减少重复维修。车队报告显示,预测性维护每辆车年节省高达2500美元,显著提升运营效率和服务可靠性。

人工智能助力还是加剧气候危机?选择权在人类

人工智能助力还是加剧气候危机?选择权在人类

全球气候危机加剧之际,人工智能技术呈现双面性特征。一方面,AI可通过智能电网减少20%能源浪费,精准农业技术优化水资源利用,智能交通系统降低30%城市排放。另一方面,训练单个大型AI模型耗电数千兆瓦时,排放数百吨二氧化碳。数据中心用电量预计2024-2030年年增15%,远超其他行业增速。解决这一矛盾需要优先开发高效AI架构,建立环境影响评估机制,确保AI发展服务于气候目标而非加剧环境负担。

ChatGPT词汇表:53个人工智能术语必知指南

ChatGPT词汇表:53个人工智能术语必知指南

人工智能正在全面改变互联网,从ChatGPT的火爆到谷歌在搜索结果中嵌入AI摘要。本文整理了53个重要的AI术语,涵盖从基础概念到前沿技术的完整词汇表。包括人工通用智能、大语言模型、神经网络、机器学习等关键概念,以及ChatGPT、Gemini、Claude等主流AI产品介绍,帮助读者深入理解AI技术生态。

ChatGPT正在测试神秘新功能"一起学习"

ChatGPT正在测试神秘新功能"一起学习"

部分ChatGPT订阅用户发现工具列表中出现名为"Study Together"的新功能。该模式旨在提升教育工具效果,不直接提供答案而是引导用户思考并回答问题,类似谷歌LearnLM。用户猜测可能支持多人学习小组模式。ChatGPT在教育领域应用广泛但存在争议,教师用于制定教学计划,学生可当作辅导工具但也可能用于作弊。这一功能或许能鼓励正当使用同时减少学术不端行为。

Capital One如何构建生产级多智能体AI工作流程来支持企业应用

Capital One如何构建生产级多智能体AI工作流程来支持企业应用

Capital One推出了生产级多智能体AI系统来增强购车体验。该系统包含四个协作的AI智能体:一个与客户沟通,一个基于业务规则创建行动计划,一个评估前两者的准确性,一个向用户解释和验证计划。系统设计时考虑了金融机构的严格要求,采用动态迭代方法,并融入了风险管理框架。技术上使用开源权重模型和NVIDIA推理堆栈。首个应用Chat Concierge已在汽车业务中部署,客户参与度提升达55%。

Graid基于Nvidia GPU的RAID卡技术突破及产品路线图

Graid基于Nvidia GPU的RAID卡技术突破及产品路线图

Graid公司专注于英伟达GPU驱动的RAID卡技术,推出包括企业级和工作站版本在内的SupremeRAID产品线。该公司2024年营收翻倍,出货约5000张卡片,预计2025年增长60%。产品路线图涵盖桌面简化版、AI版本、HPC版本等五个组件,支持NVMe RAID并提供企业级数据保护。AI版本支持GPUDirect直接传输,HPC版本针对BeeGFS等环境优化。

AI驱动数据产业整合潮流,但这不是全部真相

AI驱动数据产业整合潮流,但这不是全部真相

数据行业正面临重大变革,市场整合趋势明显。近期Databricks以10亿美元收购Neon、Salesforce以80亿美元收购Informatica等交易显示,更多并购即将到来。被收购公司虽规模不同,但都有共同点:买方希望通过收购技术促进企业AI采用。AI成功取决于优质数据访问,但收购ChatGPT前时代的公司能否真正推动当今AI采用仍存疑问。

亚马逊第100万台仓储机器人正式上岗,AI赋能更智能化

亚马逊第100万台仓储机器人正式上岗,AI赋能更智能化

亚马逊机器人部门宣布已部署超过一百万台仓储机器人,并推出DeepFleet人工智能系统。该系统如交通控制器般协调机器人运行,提高移动效率并避免拥堵。从2012年开始测试至今,这些机器人已成为亚马逊履行中心的主力,遍布300多个仓库。DeepFleet基于AWS构建,能实时重新规划机器人路径,将行进时间缩短约10%。亚马逊表示机器人创造了更多技术岗位而非取代人工。

企业领导者需要了解的开源与专有AI模型选择策略

企业领导者需要了解的开源与专有AI模型选择策略

企业在采用生成式人工智能时,需在开源模型与专有模型间做出选择。真正的开源AI包括模型架构、训练数据和权重,但完全开源的模型很少。多数企业会混合使用两种模型。对于银行等受监管行业,开源模型是唯一选择,因为数据不能离开本地。开源模型提供更大灵活性和深度定制,而专有模型在成本和延迟方面具有优势。随着开源模型性能提升,专有模型的财务可行性面临挑战。企业领导者应根据具体需求选择最适合的模型组合。

影子AI风险:大语言模型应用的治理挑战

影子AI风险:大语言模型应用的治理挑战

影子AI指员工在企业IT政策和数据治理控制之外私自使用未经授权的人工智能服务。研究显示,2024年企业生成式AI流量激增890%,与生成式AI相关的数据泄露事件增长一倍以上。开发人员为提高效率和缩短产品上市时间,常绕过AI安全防护措施,使用未经审查的开源大语言模型或AI代码生成工具,这可能导致知识产权泄露、系统安全漏洞和供应链完整性问题。专家建议采用统一平台方法,将AI治理和开发者工作流程整合到单一系统中。

欧洲核子研究中心的粒子物理数据处理技术访谈

欧洲核子研究中心的粒子物理数据处理技术访谈

欧洲核子研究中心(CERN)作为大型强子对撞机的所在地,已成为开放量子研究所三年试点阶段的基地。该中心高级顾问夏尔玛介绍,计算是CERN的三大支柱之一。中心需要将每秒4000万次碰撞的数据快速筛选至1000次,再缩减至100次,处理时间约为2.5毫秒。CERN依靠模式识别和机器学习处理实验产生的庞大数据集,通过仿真模型预测碰撞结果。该中心开发的白兔精密定时系统将应用于量子计算纠错技术。

英伟达用分层KV缓存和Dynamo引擎扩展大语言模型内存

英伟达用分层KV缓存和Dynamo引擎扩展大语言模型内存

英伟达通过Dynamo引擎实现分层KV缓存,将大语言模型的键值对存储从GPU高带宽内存扩展至CPU内存、直连SSD和网络存储。该技术解决了GPU内存不足时向量数据被驱逐需重新计算的问题,通过多层存储架构提升推理效率。Dynamo支持vLLM等推理引擎,具备分离服务、智能路由等四大功能。目前已有Cloudian、DDN、戴尔、HPE、NetApp、Pure Storage等多家存储厂商宣布支持该技术。

基于场景驱动的模拟测试无法保护我们免受通用AI和超级AI的威胁

基于场景驱动的模拟测试无法保护我们免受通用AI和超级AI的威胁

本文探讨了一种防范通用人工智能(AGI)和人工超级智能(ASI)存在性风险的方法:将它们置于计算机仿真世界中进行测试。虽然这种方法看似合理,但存在诸多挑战。AGI可能会隐藏恶意行为,或因被欺骗而转向恶意。此外,仿真环境可能无法完全模拟真实世界,导致测试结果不准确。构建高质量仿真系统的成本和技术难度也不容忽视。文章认为,仿真测试虽有价值,但并非万能解决方案。

AI在游戏中的表现暴露了其致命弱点

AI在游戏中的表现暴露了其致命弱点

尽管AI在围棋等复杂游戏中表现出色,但在简单的井字棋游戏中却屡屡失败。研究显示,AI代理在模拟商业环境中的表现同样令人失望,经常出现幻觉、欺骗和任务未完成等问题。游戏测试为评估AI能力提供了直观方式,帮助普通用户理解AI的真实水平。面对当前AI行业的过度宣传,通过游戏化测试揭示AI的实际局限性,对于防范AI泡沫具有重要意义。