生成式AI(AIGC)无疑是当下最热门的话题和应用,各家软硬件厂商都在全力投入。
作为拥有强大硬件、广泛生态的行业领袖,Intel也正在大力推动PC AIGC应用的落地,从硬件到软件提供全方位支持。
目前在PC平台上,Intel已发布的12/13代酷睿、Arc A系列显卡,以及即将发布的下一代酷睿,都能满足AIGC对于高算力的需求。
再加上软件生态的构建和模型的优化,AIGC场景在台式机、轻薄本、全能本、游戏本等设备上都能落地应用,从而大大提高热门的日常生活、工作效率。
其中,基于OpenVINO PyTorch后端的方案,通过Pytorch API,可以让社区开源模型很好地运行在Intel客户端处理器、集成显卡、独立显卡和专用AI引擎之上。
比如说, Stable Diffusion的实现Automatic1111 WebUI,已经能够通过上述方式,在Intel处理器、显卡上运行FP16浮点精度的模型,支持文生图、图生图、局部修复等功能。
更进一步地,Intel通过模型优化,降低了模型对硬件资源的需求,进而提升了模型的推理速度,让社区开源模型能够很好地运行在PC上。
眼下,Intel 13代酷睿通过XPU加速、low-bit量化,以及其它软件层面的优化,可以让最高达160亿参数的大语言模型,通过BigDL-LLM框架运行在16GB及以上内存容量的个人电脑上。
已经验证过的模型包括但不限于:LLAMA/LLAMA2、ChatGLM/ChatGLM2、MPT、Falcon、MOSS、Baichuan、QWen、Dolly、RedPajama、StarCoder、Whisper等,并通过Transformers、LangChain API接口支持Windows、Linux的操作系统。
即将发布的代号Meteor Lake的酷睿Ultra系列,更会成为PC AI历史上的重要里程碑。
酷睿Ultra它将通过分离式模块架构,集成名为“VPU”的独立AI加速单元,为PC用户提供AI驱动的新功能、新应用,比如Adobe Premiere Pro中的自动重新构图、场景编辑检测等等,还有更高效的机器学习加速。
目前,Intel正与PC产业伙伴合作,加速AI加速应用的落地和普及,未来后续基带产品也会进一步扩展AI能力。
另一方面,Intel Arc锐炫显卡通过驱动和补丁更新,已经可以较好地支持Stable Diffusion,性能提升效果相当显著。
Tom's Hardware就分别测试了Arc A770 16GB、Arc A750,使用了Automatic1111 WebUI OpenVINO。
在此之前,Arc A770 16GB、Arc A450的性能相比RTX 4060落后在20%左右,如今分别大幅提升了54%、40%,对比RTX 4060能分别领先25%、6%。
要知道,它俩的游戏性能其实远不如RTX 4060,但如今AI效率却更高,足可见Intel的硬件性能和软件优化相当给力。
再看看AMD显卡的表现,就更加凸显Intel的进步了,RX 6000系列的效率依然低得令人发指,RX 6800都只有Arc A750的一半多一点点。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。