近日,在深圳昇腾创新中心的支持下,爱可生向量数据库(TensorDB)完成了与华为Atlas 800推理服务器和全场景AI框架昇思MindSpore的兼容性测试,实现了爱可生向量检索技术与昇腾AI基础软硬件平台的全面融合。
上海爱可生信息技术股份公司
上海爱可生信息技术股份有限公司是国内知名的分布式数据库、开源数据库解决方案以及数据处理技术提供商。公司自主研发的云树数据中台、数据库集群管理平台、数据库云平台软件、向量数据库等产品已被广泛应用于金融、电力、智能制造、电信、广电、交通等行业,标杆客户包括:中国工商银行、兴业银行、中国农业银行、太平洋保险、友邦保险、中国人保、国家电网、上汽集团、中国移动等世界500强企业。
向量数据库(TensorDB)的目标是在以图搜图、视频推荐、文本检索等常见的AI场景中,对海量非结构化数据嵌入后的高维数据提供存储、管理、计算的综合能力,以满足金融、交通、互联网等行业对核心业务系统高可用性、高扩展性的要求。
爱可生向量数据库(TensorDB)
企业版
基于昇腾AI,TensorDB内核的众多计算任务实现了深度优化:
① 降低了向量计算、矩阵计算等高维数据之间计算带来的消耗,提升了检索算法的批处理能力,同时读入并计算的请求数可达每秒4000次。
② 保障了不同维度、数量级的向量数据训练和检索的稳定性,在不损失检索精度的前提下,使模型训练的收敛速度提升4倍以上。
③ 充分利用算子可以异步执行的特点,实现了数据预处理、多种计算类算子、数据后处理在不同线程、不同流之间并发,将索引过程提升10倍以上。
【向量数据库TensorDB解决方案整体架构图】
随着存储成本的下降,以及新兴技术的发展,各行各业对非结构化数据的重视程度将越来越高。昇腾AI将努力做好基础软硬件平台,发挥在人工智能领域积累的技术优势,携手爱可生等伙伴,共同加强数据场景能力建设,共同服务中国数字经济转型升级。
好文章,需要你的鼓励
当前企业面临引入AI的机遇与挑战。管理层需要了解机器学习算法基础,包括线性回归、神经网络等核心技术。专家建议从小规模试点开始,优先选择高影响用例,投资数据治理,提升员工技能。对于影子IT现象,应将其视为机会而非问题,建立治理流程将有效工具正式化。成功的AI采用需要明确目标、跨部门协作、变革管理和持续学习社区建设。
这项由东京科学技术大学等机构联合发布的研究提出了UMoE架构,通过重新设计注意力机制,实现了注意力层和前馈网络层的专家参数共享。该方法在多个数据集上显著优于现有的MoE方法,同时保持了较低的计算开销,为大语言模型的高效扩展提供了新思路。
美国垃圾收集行业2024年创收690亿美元,近18万辆垃圾车每周运营六至七天,每日停靠超千次。设备故障成为行业最大隐性成本,每辆车年均故障费用超5000美元。AI技术通过实时监控传感器数据,能提前数周预测故障,优化零部件库存管理,减少重复维修。车队报告显示,预测性维护每辆车年节省高达2500美元,显著提升运营效率和服务可靠性。
小米团队开发的MiMo-7B模型证明了AI领域"小而精"路线的可行性。这个仅有70亿参数的模型通过创新的预训练数据处理、三阶段训练策略和强化学习优化,在数学推理和编程任务上超越了320亿参数的大模型,甚至在某些指标上击败OpenAI o1-mini。研究团队还开发了高效的训练基础设施,将训练速度提升2.29倍。该成果已完全开源,为AI民主化发展提供了新思路。