早在12年前,谷歌和Alphabet前首席执行官兼执行主席Eric Schmidt就有过一句名言:“从人类文明诞生到2003年,共有5EB的信息被创造出来,但现在每两天就能产生这么多信息,而且速度还在加快。”
毋庸置疑,我们正处于数据爆炸的时代,根据IDC的报告,到2025年,全球数据总量将达到163ZB,其中企业占比将达到60%。然而,1ZB到底有多大?直观来说,如果把1ZB的文件装在1TB的硬盘里,则需要大约10亿块1TB的硬盘,连接起来足够绕地球两圈半。
可以说,商业活动正在创造不可计量的数据。如今,越来越多的数据被分散在本地部署资源以及由多个公有云供应商提供的托管服务中,这就是大家所熟知的多云策略。
Veritas调研结果显示,约66%的中国企业正采用超过5种云服务,约85%的中国企业的数据和应用均同时存储在私有云/本地部署和公有云中。多云承载的数据无处不在,那么问题来了:又该如何管理每天都在极速增长的海量数据呢?
一言以蔽之,单靠纯人工是没办法管理的。尤其是需要正确管理数据:既要使企业免遭勒索软件和其他威胁,同时又要确保其符合数据管理条例并能创造商业价值。这时基于人工智能(AI)的自治数据管理就有用武之地了。
在此,有些常见误区需要澄清:自治与自动化,人工智能与机器学习(ML)。正如ADLINK Technology 的Toby McClean所阐述的:“自治是自给自足的,不需要人为干预;它可以学习并适应环境,随着周围环境的变化而进化。但自动化仅限于有明确标准的特定任务,并且只能执行规定任务。”
那么自治系统怎样运行呢?通过人工智能。人工智能就是电脑系统具有像人类一样自己思考的能力。系统通过数学和逻辑模仿人的思维,从新信息中学习并做出决策,而机器学习是通过数学建模继续开发智能的。
长期以来,自动化在数据管理中都发挥了很重要的作用。最开始被用作备份软件,在每段预设时间后自动保存特定存储里的数据,或是被触发时进行备份。后来,开始处理一些更复杂的操作,例如发现并保护新的工作负载等。
如今由人工智能驱动的自治为异常检测提供了极大支持,来抵御不断演变的威胁的侵扰。勒索软件的速度已经快至可以在43分钟内加密54GB的数据。人工智能目前也能预测备份存储设备中的硬件故障,并使相关硬件能够在故障发生之前被更换,以免影响备份性能以及故障恢复。
下一步,也就是不久的将来,是实现人工智能驱动技术为企业向多云环境中迁移的大量数据提供完全自主的自我配置、自我优化和自我修复数据管理服务。Veritas已经在此方向进行研究和创新。在2022年度全球大会Conquer Every Cloud上,Veritas全面阐述了数据自治战略,即NetBackup利用人工智能和超自动化可在多云环境中进行自我配置、自我优化和自我修复。在实际运用中,当部署新服务和用户时,会以自动提供数据保护策略的方式呈现,并自动监控和推出与观察到的公司数据使用情况相匹配的新策略。当然,这一切都不需要人工决策。
由人工智能和机器学习驱动的自治数据管理可以实现之前仅仅是美好设想而不能实现的事情。自治数据管理不仅能应对如今及未来的数据趋势和与之俱来的挑战,同时还能为企业提供自动数据保护及恢复,让IT人员可以专注于更具战略性、变革性的关键工作中。
现在就开始为企业的未来做准备吧。重新调整业务优先级、战略和结构,解放企业的技术团队劳动力资源,使其投身到更具战略意义的领域。
关于Veritas
Veritas Technologies是多云数据管理领域的领导者。超过八万家企业级客户, 包括95%的全球财富100强企业,均依靠Veritas确保其数据的保护、可恢复性和合规性。Veritas在规模化的可靠性方面享有盛誉,可为企业提供抵御勒索软件等网络攻击威胁所需的弹性。Veritas通过统一的平台,支持超过800种数据源,100多种操作系统,1400多种存储设备以及60多类云平台。在云级技术的支持下,Veritas现正在实践其数据自治战略,在提供更大价值的同时,降低运营成本。
好文章,需要你的鼓励
两家公司在OverdriveAI峰会上分享了AI应用经验。Verizon拥有超过1000个AI模型,用于预测客户呼叫原因和提供个性化服务,将AI推向边缘计算。Collectors则利用AI识别收藏品真伪,将每张卡片的鉴定时间从7分钟缩短至7秒,估值从8.5亿美元增长至43亿美元。
阿布扎比科技创新研究院团队首次发现大语言模型生成的JavaScript代码具有独特"指纹"特征,开发出能够准确识别代码AI来源的系统。研究创建了包含25万代码样本的大规模数据集,涵盖20个不同AI模型,识别准确率在5类任务中达到95.8%,即使代码经过混淆处理仍保持85%以上准确率,为网络安全、教育评估和软件取证提供重要技术支持。
Hammerspace发布v5.2数据平台软件,通过更快的元数据读取、更好的数据放置和扩展性优化提升AI数据访问性能。新版本IO500总分提升33.7%,总带宽翻倍,IOR-Hard-Read测试提升超800%。增加了Tier 0亲和性功能,支持GPU服务器本地存储访问,减少集群内网络流量。新增Oracle云支持、Kerberos认证和标签化NFS,提供更细粒度的访问控制。该软件将于12月正式发布。
斯坦福大学研究团队首次系统比较了人类与AI在文本理解任务中的表现。通过HUME评估框架测试16个任务发现:人类平均77.6%,最佳AI为80.1%,排名第4。人类在非英语文化理解任务中显著优于AI,而AI在信息处理任务中更出色。研究揭示了当前AI评估体系的缺陷,指出AI的高分往往出现在任务标准模糊的情况下。