客户面临着一个重大挑战:如何使 AI 更容易访问海量的分布式企业数据,使其推导并产生基于洞察的业务成果?同时如何以更高的成本效率做到这点?
从多云环境中提取数据,数据质量和数据整合会成为主要问题。此外,数据孤岛往往会使数据整合变得复杂,阻碍集中式数据管理,增加数据访问难度。企业在试着整合其企业数据、理解并使之有用的过程中,数据的复杂性往往又会增加其人力资源负担,提高运营成本,降低决策速度。
三年前推出的 IBM Cloud Pak for Data 可以为企业赋能,使其能将 AI 应用到跨任何混合云环境的数据之上。自那时起,汉莎航空 (Lufthansa)、美国州立农业保险(State Farm)和瑞银 (UBS) 等客户就已开始利用 IBM Cloud Pak for Data 的这些能力,提取其企业数据的价值,为其 AI 引擎提供燃料。
现在,IBM 把基于 AI 的新能力注入 Cloud Pak for Data 的智能数据经纬,其中包括一项名为 AutoSQL(结构化查询语言)的突破性技术。AutoSQL 技术可实现 AI 自动访问、整合和管理数据的功能,无需考虑数据存储位置,也无需移动数据。利用其新的数据经纬和 AI 能力,通过对数据和 AI 生命周期实现自动化(释放时间、金钱和资源潜能),IBM 可以为客户带来未来可期的重大竞争优势,在正确的时间把正确的数据提供给合适的人,同时节省资源。
关于下一代 IBM Cloud Pak for Data 的新能力及其对企业业务的重要性,以下 5大必知之事,您需要了解一下:
1. 跨混合多云环境实现数据访问自动化,无需移动数据
AutoSQL 这项新技术旨在帮助客户实现 AI 自动访问、整合和管理数据的功能,是客户无需考虑数据存储位置、无需移动数据。这种能力对于寻求在 AI 领域获得成功的企业至关重要。据 IBM 新发布的《2021年全球 AI 采用指数》,约 90% 的企业表示,无需考虑数据存储位置而能随处运行 AI 项目,是他们采用 AI 的关键;然而,32% 的企业表示,不断加剧的数据复杂性和数据孤岛是他们采用 AI 的主要障碍。
2. 旨在助您提高数据查询速度
AutoSQL 这项新技术针对不同的数据源(包括数据仓库、数据湖和流数据),使用相同的查询引擎,无需额外进行手动调整或移动数据,从而帮助企业节省时间和资源,免于移动数据及维护多个查询引擎。随着 AutoSQL 技术的推出,IBM Cloud Pak for Data 现已整合了市场上性能最强的云数据仓库(依据我们的基准研究),可以利用 AI 帮助客户获取分布式查询结果,与其他数据仓库相比,其速度较之前提升 8倍,成本下降近半。
3. 一个智能的数据经纬把 AI 赋能的新能力“编织”在一起
Cloud Pak for Data 的基础是我们全新的智能化数据经纬,利用 AI 来实现复杂数据管理任务的自动化,把所有新的 AI 能力“编织”在一起,其中就包括 AutoSQL 技术。这一数据经纬的构建是为了发现和统一不同的数据源——无论是数据湖、数据目录,还是数据仓库——将其整合在同一视图之下,帮助企业用户通过一个统一的访问入口来找到、理解、构建和使用跨整个企业系统的数据。而我们看到的传统做法是,企业要用手动的方式把不同数据源的数据整合到一个平台之上。而这种新型数据经纬可以简化混合云环境的复杂度,帮助企业用户确保在不危害隐私、安全和合规性的前提之下,访问所需数据。
4. 智能化数据经纬把 AI 赋能的新能力整合成目录,同时保护数据
作为新型智能数据经纬的组成部分和 AutoSQL 技术的补充,AutoCatalog 是一个由 AI 赋能的“大脑”,它可以对数据的发现和分类流程实现自动化,以维护来自不同数据环境的数据资产的实时目录,专为跨企业的不同业务团队轻松查找数据而设计。AutoPrivacy 是 IBM Cloud Pak for Data 中可用通用数据隐私框架的关键部分。AutoPrivacy 旨在使用 AI,智能地实现企业内部敏感数据识别、监控以及后续政策实施的自动化。
5. 推进“Watson Anywhere”策略,重申 IBM 把 AI 带给随处存储的数据的独到能力
此次发布进一步拓展了 IBM Watson Anywhere 的策略。与他人不同的是,IBM 正致力为客户赋能,帮助他们把 AI 带给他们随处存储的数据,而不是把数据带给 AI。
在上周召开的 Think 2021 大会上,您也许已经了解了 ING、CitiBank、Verizon 等企业成功应用 AI 的故事。虽然 AI 的变革力量不容置疑,但是千里之行始于足下,要将发展 AI 的愿望转化为业务成果,要从构建一个坚实基础开始,也就是要从解决当今多样化数据格局的复杂性开始。
在此,我们特意摘选了几位客户在 Think 2021 大会上的发言如下:
ING 科技集团服务首席架构师 Ferd Scheepers 说:
“我们需要一个统一的数据层来映射数据,利用 AI 来理解数据意义,执行相关政策——在法律禁止个人数据出境的国家和地区防止数据的跨国移动,同时竭尽所能做好现在所需的工作来构建自我。这正是数据经纬所承诺的,以活跃的元数据来驱动我们利用数据的可能性,让数据在不同地区和不同云之间持续可用,无论数据客户需要在何处、以何种方式使用数据,都无需依赖长达一年之久的 IT 项目来访问他们所需的数据。”
“数据被限制在跨企业的孤岛、传统数据仓库和数据湖的各个孤立环境之中,使我们无法规模化地整合数据。因此,我们正在引入数据经纬,打造一个让我们可以整合企业数据的通用平台。现在,利用数据经纬,我们能实现一致的数据管控,这一经纬层让我们能够实现规模化数据整合......我们重新对控制措施进行统一化,让员工可以更轻松地访问数据。”
好文章,需要你的鼓励
Oracle宣布推出Oracle AI Database 26ai和Oracle Autonomous AI Lakehouse两款产品。AI数据库26ai作为长期支持版本,在数据库引擎中原生集成AI功能,包括AI向量搜索、模型上下文协议服务器支持和AI代理框架。该版本还提供量子安全加密和硬件加速支持。自主AI湖仓平台结合了自主AI数据库和Apache Iceberg表格式,支持跨云和混合环境的AI分析工作负载,提供动态扩展和统一数据治理能力。
圣母大学研究团队发布了迄今最全面的大语言模型跨学科应用调研报告,系统梳理了AI在人文、商业、科学工程等13个领域的应用现状。研究发现,大语言模型在文本处理和模式识别方面表现优异,但在创造性思维和价值判断上仍有局限。报告强调人机协作是未来发展方向,并为不同需求用户提供了具体的模型选择建议。
Gartner研究显示,45%的CIO开始与C级高管合作推进数字化转型项目。成功的数字化转型需要CIO与业务领导者共同承担责任,将数字化能力交给最接近价值创造点的团队。这种合作模式要求预算共担、高管直接参与项目会议,以及明确的责任分工。当双方共同投资并积极参与时,项目成功率显著提升。
复旦大学团队开发的SIM-CoT方法突破了AI推理效率瓶颈,让机器学会在"脑海"中思考而非必须表达每个推理步骤。该方法通过巧妙的监督机制解决了隐式推理训练不稳定问题,在保持高效率的同时显著提升准确性,在GPT-2和LLaMA系列模型上均表现出色,为AI推理技术开辟新路径。