近年来,GPU数据库因其强大的并行计算能力、较大的内存宽带和容量,使其可用性及优势越来越明显,国内互联网巨头、传统数据库企业等都纷纷布局GPU数据库市场。
2013年,上海雅捷信息技术股份有限公司(以下简称“雅捷”)研发团队开始基于GPU的高性能分布式数据库的研发,并积极实现数据库的国产化。2020年,雅捷与海光信息开始合作,探索具备自主知识产权的异构加速卡与数据库产品的结合。得益于海光完备的工具链和友好的跨平台迁移能力,在雅捷与海光工程师的通力合作下,仅两个月就完成了从国外平台向国内海光平台的迁移工作。经过不断的优化与改进,迁移后的数据库性能要优于同级的国外产品,基于GPU的高性能分布式数据库渐成雏形。
雅捷董事长、CEO郑学强介绍,“基于GPU的高性能分布式数据库”(以下简称DataTurbines)有三大优势:一是较强的创新性,随着AI技术的飞速发展,GPU数据库的创新价值将凸显;二是建立于国产海光的异构加速芯片之上,在系统的兼容性上具有较强的优势;三是从国家政策层面鼓励创新,“基于GPU的国产高性能分布式数据库”方案目前在国内尚无先例。
目前雅捷的DataTurbines数据库产品在金融和工业领域都取得了不错的成绩。在金融领域,DataTurbines被应用于金融行业的在线分析系统、交易风控系统及大数据数仓平台等核心业务领域,替代国外的一体机产品,不仅为企业省下了昂贵的系统授权维护费用,还引入了新硬件、新功能。在工业安全领域,复杂工业领域的安全仿真算法一直被几家国外老牌算法公司垄断。雅捷和高校实验室通力合作,通过自研工业安全算法,再结合DataTurbines数据库自身的分布式架构及GPU硬件加速能力,使得算法的运行效率和精度都大幅提升,不仅填补了复杂工业安全软件的空白,也打造了更安全高效的数字底座。
2022年,雅捷通过参加光合组织举办的“第二届AI解决方案大赛”,进一步加深了与海光的合作,完善了产品功能,并正式推出基于海光整机与雅捷DataTurbines的智能数据一体机(以下简称“一体机”)。一体机着眼于通过软硬件结合的方式,实现产品更好的优化,使用户体验更顺滑、更安全。
针对产品以后的发展,郑学强表示将着眼于两方面:一是在可信计算、数据安全方面与海光展开更加深入的合作,将海光的安全平台特性引入到DataTurbines项目中,打造新一代高性能多功能的金融数据一体机平台;二是适配国产自主的、先进的落地应用,比如,AI大模型、AI训练或是基于AIGC落地应用等,进一步深度去优化产品。
目前,随着AI大模型的发展,雅捷已开发出支持向量数据和结构化数据一体的多模态数据库版本,“在AI时代到来后,这将是生成式AI应用的重要基础平台。”郑学强表示。
好文章,需要你的鼓励
博通宣布对VMware Cloud Foundation平台进行重大升级,将私有AI服务集成到核心订阅中,并为vSAN存储虚拟化软件添加云原生对象存储支持。此举旨在满足企业对简化基础设施、高效AI采用和网络安全的需求。升级包括与英伟达合作的VMware Private AI Foundation服务、支持AMD GPU、Amazon S3兼容对象存储、与Canonical合作的Ubuntu容器镜像,以及新的四阶段自动化安全流程。博通还推出了面向高监管行业的VCF网络合规高级服务。
清华大学等多家机构研究团队完成了语音分离技术的全面调研,系统梳理了从传统方法到深度学习的技术演进。研究揭示了"鸡尾酒会问题"的核心挑战,分析了各种学习范式和网络架构的优劣,并通过统一实验框架提供了公平的性能基准。调研涵盖了实时处理、轻量化设计、多模态融合等关键技术方向,为学术界和产业界的技术选型提供了重要参考,推动语音分离从实验室走向实际应用。
Google正式发布Gemini 2.5 Flash Image模型,该模型此前在测试版中被称为nanobanana。新模型为企业创意项目提供更多选择,能够快速修改图像外观并提供比以往模型更强的控制能力。该模型在保持人物相似度和编辑一致性方面表现出色,支持多轮编辑、照片融合等功能,并已集成到Gemini应用中供付费和免费用户使用。
浙江大学和腾讯微信视觉团队发现AI图片生成训练中"时机胜过强度"的重要规律,开发出TempFlow-GRPO新方法。通过轨迹分支技术精确评估中间步骤,结合噪声感知权重调整优化不同阶段的学习强度,将训练效率提升三倍,在复杂场景理解方面准确率从63%提升至97%,为AI训练方法论带来重要突破。