一 个趋势是,为了获得敏捷性、降低成本并实现竞争优势,企业正在通过将更多基础设施转移到云中来实现 IT生态系统的现代化。 第二 个趋势是,为了分析数据、挖掘有价值的洞察力和燃料创新,组织正在使用人工智能和 ML应用程序。 交织这两种趋势的是采用云本地数据平台,从整个企业收集和编目数据。
这一令人兴奋的数字转型意味着组织将拥有必要的工具,让更多的员工能够访问数据,同时通过人工智能和 ML增加分析的范围和深度。 借助 IBMCloud Pak® for Data这样的平台,数据科学家可以通过增加数量级的分析量来加速创新。
但是,新的技术进步会产生大量的隐私、安全和合规问题。 快速创新有时会超过安全性,带来新的风险。 要解决这些问题,你必须:
维护跨容器和应用程序的可见性确定基础结构漏洞是否将数据置于风险之中在违反期间,如果主机平台的标准安全措施将满足您的需要,请确定正确的人员是否能够访问正确的数据识别数据的使用是否符合隐私法规
这些关切只是旨在消除脆弱性的全面安全战略的一部分。
在任何情况下,解决法规遵从性需求都可能是昂贵和耗时的。 在采用迁移到新环境的云本地数据和 AI平台时,您的组织将面临相同的监管挑战。 要使这种向民主化数据的转换成功,您需要改进组织的安全治理、安全性和遵从性实践。
安全挑战
许多企业跨不同的位置存储数据,从而形成存储、控制和可见性的筒仓。 受治理的数据飞机——如 Azure、 AWS、 Google或 IBM Cloud Pak for Data提供的那些——提供了强大的治理特性,但它们不是安全解决方案。
数据存储本身可能带来额外的安全挑战,包括连接到数据平面的本地和混合多声音数据库,以及存储在 Cloud Pak for Data上的集装箱化数据库(其中一些是开源数据库)。
为了对数据进行更细粒度的控制,安全领导者可能希望自己掌握权力,以确保数据受到保护。 例如,企业可以选择在平台上启动容器化数据库,如 MongoDB、 PostgreSQL或 IBM的Db2。 这种实践提供了更大的灵活性,可以轻松地扩展数据存储容量和性能,但也带来了安全权衡。 这些数据库可以存储重要的数据资产,如金融、法律文件、商业秘密或研发,以及受监管的数据,如客户的个人身份信息。
鉴于存储在数据和人工智能平台上或由数据和人工智能平台访问的数据的敏感性,企业领导人应该考虑:
谁拥有并管理平台?是否存在基于平台的漏洞?如果从第三方部署容器映像,存在哪些漏洞?是否可以在特权数据方面强制实施与云供应商或管理员的职责分离?在“信任但验证世界”中,是否可以确保具有完整的数据使用审核历史?
请了解这些注意事项只涉及存储在云本地平台上的数据库,而不涉及链接到该平台的外部数据存储。 对于这些环境,您还需要实现可见性、访问控制,并能够检测和包含潜在威胁。 除了这些安全问题外,合规方面的挑战依然存在。
合规挑战:
随着越来越多的社会和经济活动转移到网上,公司继续收集越来越多的客户个人信息。 随着头条新闻中出现新的高调数据泄露事件,各国政府面临越来越大的监管压力,各组织也面临着越来越大的改善保护工作的压力。 为了满足监管审核,你必须遵守你开展业务的地方的现行法规。
审计和报告法规遵从性可能是一个缓慢和资源密集的过程。 当企业的数据足迹扩大时,复杂性会成倍增加。 为了避免法规遵循阻碍创新,组织必须部署通过自动化简化和加速法规遵循报告过程的解决方案。
如何保护现代化的云端本地数据环境
由于许多组织将数据存储在企业中,数据治理和安全负责人必须跨所有数据源保护其公司的数据资产。 各组织正在采用数据和人工智能平台,为人工智能应用提供强有力的数据治理和数据准备。 鉴于数据资产在这些平台上的价值和敏感性,建议数据和安全主管也部署企业级数据安全和合规报告解决方案,以统一保护所有数据环境。
正确的解决方案可以帮助保护、控制和监视对数据的访问,从阻止或隔离危险或可疑用户到扫描整个环境中的漏洞。 有效的解决方案可以简化审计和报告过程。 将最好的数据安全解决方案与现代治理的数据分析和 AI平台结合起来,可以帮助组织安全可靠地加快创新的步伐。
了解更多IBM 数据与AI解决方案请访问:http://www.zhiding.cn/special/IBM_AI
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。