9月26日,由阿里云与英特尔联合主办的“数聚云端 · 智驭未来“——阿里云数据库创新上云峰会在京举行。峰会上,阿里云重磅发布一站式敏捷数据仓库解决方案。该方案结合一站式数据管理平台DMS及云原生数据仓库AnalyticDB(简称:ADB),真正实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能业务在线化,令企业在线数据释放最大价值。
通过低代码操作,阿里云一站式敏捷数据仓库解决方案大幅降低了实时数仓的构建难度和数据加工门槛,同时可支撑企业各类高频、动态化的实时分析场景和需求,帮助用户破解实时数仓建设难题,加速企业数字化转型。
如今,数据已成为企业发展过程中必不可少的核心生产资料之一,随着企业数字化程度加深,如何通过数据提升生产力是企业不断探索的方向。作为数据集成、开发和服务的核心载体,数据仓库在其中发挥着关键作用。
传统数据仓库一般基于T+1数据集成构建离线数仓,以支撑企业各项分析与服务。传统方案不但会影响线上业务稳定性,且难以支持企业的实时需求,随着企业对于数据价值变现和应用的时效性要求越来越高,实时数仓应运而生。
阿里云一站式敏捷数据仓库解决方案基于阿里集团多年实时数仓建设经验,结合一站式数据管理平台DMS及云原生数据仓库ADB,支持业务数据实时入仓+增删改查、基于拉链表的T+1周期性快照等功能,充分满足企业应用场景对生产数据进行实时分析的需求,如:促销大屏、监控报表、精准营销、交互式运营分析等。
传统实时数仓构建方案通常难以满足多源异构数据实时入仓的需求,同时数据处理链路较长,效率无法保证。相较于传统方案,阿里云一站式敏捷数据仓库解决方案有如下4大核心优势:
1、对业务侧影响小,不会因为数据汇聚集中和实时加工影响业务侧正常运行,CPU、内存占用低于5%
2、事务顺序和数据准确性有保障,且处理链路短,支持在线数据实时处理落仓,效率更高。数据传输效率100m/s,数据延时在10秒内
3、支持复杂实时数据加工、计算逻辑
4、低代码操作,能够大大降低实时数仓的构建难度,提升构建效率的同时,支撑企业数字化转型过程中的各类实时场景
DMS集成数据传输服务DTS,可支持数十种数据源的存量数据+增量更新数据,实时同步到ADB,确保实时数仓侧数据与生产端保持一致。此外,DTS支持在实时数据入仓、数据集成过程中,对数据进行实时加工处理,帮助企业降本增效。
除了实时统计分析场景外,企业为满足周期性数据分析需求,需建设周期性全量快照。传统数仓的周期性全量集成方案会对生产业务造成稳定性影响、全量集成时效性差、且无法满足客户针对任意时间点进行数据回溯的业务诉求。
针对T+1周期性集成场景,一站式敏捷数据仓库解决方案支持基于拉链表的T+1全量数据快照,用户通过简单几个步骤,即可按需生成各种周期的全量或增量快照。此外,业务还可按需进行任意时间点的数据回溯,以快速解决数据异常问题。
某银行实时数仓构建案例
以某银行为例,该银行采用一站式敏捷数据仓库方案构建实时数仓,以支持各业务线高效、定制的分析和决策需求。DMS集成DTS非侵入式实时日志解析能力,进行数据实时入仓,极大降低了数据同步过程中对业务系统的资源消耗,对业务操作零干扰,大幅降低实时数仓建设难度。此外,方案助力该银行按T+1(小时)频率快速生成快照表,千万数据级快照只需3分钟,结合ADB对海量数据的毫秒级交互式分析能力,进一步提升了实时数仓对分析决策的支撑效率。
阿里云资深技术专家、数据库产品事业部生态工具部负责人陈长城
阿里云资深技术专家、数据库产品事业部生态工具部负责人陈长城表示:“一站式数据管理DMS的目标是帮助企业在线数据价值最大化,企业通过一站式数据管理DMS+ADB可快速构建实时数仓,实现库仓一体的技术架构。
相比传统方案,可有效解决多种在线数据资产化的难题,实现按需建仓、数据集中和敏捷开发。借助库仓一体的DMS数据传输与加工链路,大大缩短数据流ETL链路,降低维护成本,通过数据开发进行灵活的任务编排和产品化支持T+1场景,可降低数据加工门槛,快速发挥企业在线数据价值。”
阿里云研究员、数据库产品事业部OLAP产品部负责人占超群
阿里云研究员、数据库产品事业部OLAP产品部负责人占超群表示:“云原生数据仓库AnalyticDB以云原生、数据库与大数据一体化为核心,支持一份数据多计算场景、全链路数据实时化等特点,支持结构化和非结构化数据融合分析,可实现超大规模实时增删改查、高并发低延时的按需低成本复杂分析,助力业务实现敏捷、实时、智能的数字化创新。
阿里云一站式敏捷数据仓库解决方案,结合一站式数据管理DMS+ADB为企业提供了敏捷的数据入仓、ETL管理、任务编排、资产管理等能力,将企业数据资产价值最大化,未来我们还将推出更多企业级的能力,欢迎大家关注。”
目前,阿里云一站式敏捷数据仓库解决方案已广泛应用于金融、数字政府、零售、泛互联网等行业,帮助企业建设数字化转型的基础底座。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。