9月26日,由阿里云与英特尔联合主办的“数聚云端 · 智驭未来“——阿里云数据库创新上云峰会在京举行。峰会上,阿里云重磅发布一站式敏捷数据仓库解决方案。该方案结合一站式数据管理平台DMS及云原生数据仓库AnalyticDB(简称:ADB),真正实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能业务在线化,令企业在线数据释放最大价值。
通过低代码操作,阿里云一站式敏捷数据仓库解决方案大幅降低了实时数仓的构建难度和数据加工门槛,同时可支撑企业各类高频、动态化的实时分析场景和需求,帮助用户破解实时数仓建设难题,加速企业数字化转型。
如今,数据已成为企业发展过程中必不可少的核心生产资料之一,随着企业数字化程度加深,如何通过数据提升生产力是企业不断探索的方向。作为数据集成、开发和服务的核心载体,数据仓库在其中发挥着关键作用。
传统数据仓库一般基于T+1数据集成构建离线数仓,以支撑企业各项分析与服务。传统方案不但会影响线上业务稳定性,且难以支持企业的实时需求,随着企业对于数据价值变现和应用的时效性要求越来越高,实时数仓应运而生。
阿里云一站式敏捷数据仓库解决方案基于阿里集团多年实时数仓建设经验,结合一站式数据管理平台DMS及云原生数据仓库ADB,支持业务数据实时入仓+增删改查、基于拉链表的T+1周期性快照等功能,充分满足企业应用场景对生产数据进行实时分析的需求,如:促销大屏、监控报表、精准营销、交互式运营分析等。
传统实时数仓构建方案通常难以满足多源异构数据实时入仓的需求,同时数据处理链路较长,效率无法保证。相较于传统方案,阿里云一站式敏捷数据仓库解决方案有如下4大核心优势:
1、对业务侧影响小,不会因为数据汇聚集中和实时加工影响业务侧正常运行,CPU、内存占用低于5%
2、事务顺序和数据准确性有保障,且处理链路短,支持在线数据实时处理落仓,效率更高。数据传输效率100m/s,数据延时在10秒内
3、支持复杂实时数据加工、计算逻辑
4、低代码操作,能够大大降低实时数仓的构建难度,提升构建效率的同时,支撑企业数字化转型过程中的各类实时场景
DMS集成数据传输服务DTS,可支持数十种数据源的存量数据+增量更新数据,实时同步到ADB,确保实时数仓侧数据与生产端保持一致。此外,DTS支持在实时数据入仓、数据集成过程中,对数据进行实时加工处理,帮助企业降本增效。
除了实时统计分析场景外,企业为满足周期性数据分析需求,需建设周期性全量快照。传统数仓的周期性全量集成方案会对生产业务造成稳定性影响、全量集成时效性差、且无法满足客户针对任意时间点进行数据回溯的业务诉求。
针对T+1周期性集成场景,一站式敏捷数据仓库解决方案支持基于拉链表的T+1全量数据快照,用户通过简单几个步骤,即可按需生成各种周期的全量或增量快照。此外,业务还可按需进行任意时间点的数据回溯,以快速解决数据异常问题。
某银行实时数仓构建案例
以某银行为例,该银行采用一站式敏捷数据仓库方案构建实时数仓,以支持各业务线高效、定制的分析和决策需求。DMS集成DTS非侵入式实时日志解析能力,进行数据实时入仓,极大降低了数据同步过程中对业务系统的资源消耗,对业务操作零干扰,大幅降低实时数仓建设难度。此外,方案助力该银行按T+1(小时)频率快速生成快照表,千万数据级快照只需3分钟,结合ADB对海量数据的毫秒级交互式分析能力,进一步提升了实时数仓对分析决策的支撑效率。
阿里云资深技术专家、数据库产品事业部生态工具部负责人陈长城
阿里云资深技术专家、数据库产品事业部生态工具部负责人陈长城表示:“一站式数据管理DMS的目标是帮助企业在线数据价值最大化,企业通过一站式数据管理DMS+ADB可快速构建实时数仓,实现库仓一体的技术架构。
相比传统方案,可有效解决多种在线数据资产化的难题,实现按需建仓、数据集中和敏捷开发。借助库仓一体的DMS数据传输与加工链路,大大缩短数据流ETL链路,降低维护成本,通过数据开发进行灵活的任务编排和产品化支持T+1场景,可降低数据加工门槛,快速发挥企业在线数据价值。”
阿里云研究员、数据库产品事业部OLAP产品部负责人占超群
阿里云研究员、数据库产品事业部OLAP产品部负责人占超群表示:“云原生数据仓库AnalyticDB以云原生、数据库与大数据一体化为核心,支持一份数据多计算场景、全链路数据实时化等特点,支持结构化和非结构化数据融合分析,可实现超大规模实时增删改查、高并发低延时的按需低成本复杂分析,助力业务实现敏捷、实时、智能的数字化创新。
阿里云一站式敏捷数据仓库解决方案,结合一站式数据管理DMS+ADB为企业提供了敏捷的数据入仓、ETL管理、任务编排、资产管理等能力,将企业数据资产价值最大化,未来我们还将推出更多企业级的能力,欢迎大家关注。”
目前,阿里云一站式敏捷数据仓库解决方案已广泛应用于金融、数字政府、零售、泛互联网等行业,帮助企业建设数字化转型的基础底座。
好文章,需要你的鼓励
Gartner预测,到2030年所有IT工作都将涉及AI技术的使用,这与目前81%的IT工作不使用AI形成鲜明对比。届时25%的IT工作将完全由机器人执行,75%由人类在AI辅助下完成。尽管AI将取代部分入门级IT职位,但Gartner认为不会出现大规模失业潮,目前仅1%的失业由AI造成。研究显示65%的公司在AI投资上亏损,而世界经济论坛预计AI到2030年创造的就业机会将比消除的多7800万个。
CORA是微软研究院与谷歌研究团队联合开发的突破性AI视觉模型,发表于2023年CVPR会议。它通过创新的"区域提示"和"锚点预匹配"技术,成功解决了计算机视觉领域的一大挑战——开放词汇目标检测。CORA能够识别训练数据中从未出现过的物体类别,就像人类能够举一反三一样。在LVIS数据集测试中,CORA的性能比现有最佳方法提高了4.6个百分点,尤其在稀有类别识别上表现突出。这一技术有望广泛应用于自动驾驶、零售、安防和辅助技术等多个领域。
人工智能正从软件故事转向AI工厂基础,芯片、数据管道和网络协同工作形成数字化生产系统。这种新兴模式重新定义了性能衡量标准和跨行业价值创造方式。AI工厂将定制半导体、低延迟结构和大规模数据仪器整合为实时反馈循环,产生竞争优势。博通、英伟达和IBM正在引领这一转变,通过长期定制芯片合同和企业遥测技术,将传统体验转化为活跃的数字生态系统。
中国电信研究院联合重庆大学、北航发布T2R-bench基准,首次系统评估AI从工业表格生成专业报告的能力。研究涵盖457个真实工业表格,测试25个主流AI模型,发现最强模型得分仅62.71%,远低于人类专家96.52%。揭示AI在处理复杂结构表格、超大规模数据时存在数字计算错误、信息遗漏等关键缺陷,为AI数据分析技术改进指明方向。