近年来,随着VR(虚拟现实)、AR(增强现实)、AI等相关技术的迭代演进,三维建模技术应用领域发展迅猛,各行业应用场景和落地成果不断涌现,受到行业市场广泛关注。
日前,山东大学郭亮团队依托曙光计算服务平台的异构智能计算服务,正式实现了对威海校区全部教学区域的高精度三维重建。就该案例施行情况来看,三维建模的研发应用步伐,或将受益于算力供给侧服务升级再次提速,一场由计算服务催动的科研产业创新浪潮正在拉开序幕。
高质量算力赋能高精度三维重建
不同于传统三维建模的手动模式,此次山东大学郭亮团队,联合海尔集团海纳云CIM团队及曙光智算团队,带领数据科学与人工智能本科实验班学生,利用曙光计算服务平台的异构智能算力服务,完成了AA-RMVSNet神经网络的训练,并基于训练好的模型及各类目标检测算法,在细小物体和低纹理区域场景上全方位优化,进而实现了威海校区的高精度三维重建。
建筑物高度预测
据了解,郭亮团队采用的AA-RMVSNet神经网络训练,是基于深度学习的立体视觉法(Multi-view Stereo,MVS),该方法可以借助卷积神经网络,从数据中抽取到更多有用的信息,能更好的应对高光、反射、细小物体、弱纹理等对于传统方法形成极大挑战的场景,更完整的完成室外场景下的建筑物重建。
窗户检测与计数(原图、处理图片、显示图片)
高精度、高完整度的训练建模方法,也代表着海量的数据信息处理分析难度。比如在威海校区三维重建的过程中,郭亮团队首先要通过航拍完成校园内部数据采集,再将采集到的数据通过稀疏重建获取相机位姿等参数后,转换为神经网络所需的格式。进而使用训练好的AA-RMVSNet网络,获取到深度与概率图,形成点云数据,才能完成对建筑物高度的预测。
室外各类元素检测与计数(车、空调室外机、灯杆等)
语义分割效果
同时,高精度三维重建还需要通过机器视觉算法对采集到的图片进行了进一步处理,精准检测和计数楼层、窗户等场景要素,以规避图片数据中物体畸变带来的影响。郭亮团队将这些识别结果全部映射到点云当中,完成建筑物点云数据的补齐。最终,再通过语义分割网络对二维图像上的各类目标进行检测,并同步映射到三维空间,真正实现对建筑物周边元素的补齐和重建。
商学院3D点云图与重建效果图
精密繁琐的三维重建流程,对算力供给侧提出了更高的要求。郭亮团队此次能够实现威海校区的高精度三维重建,就很大程度上有赖于曙光计算服务平台的高质量算力服务供给:可以在强劲算力支撑的基础上,实现各个异构算力需求端的海量数据分析处理。同时,在产业发展维度上,算力供给服务的迭代升级,也将反向推动科技产业创新的进程。
曙光计算服务刷新科创产业图景
曙光计算服务聚焦科学计算、工业计算、智能计算,意在打造端到端全栈算力生产、交付与应用支持平台。对三维建模等算力需求庞大的科技创新领域,以及科创产业转型升级具有重要的赋能价值。
在算力供给服务上,曙光计算服务平台具备三大优势特征。
首先,该平台凭借计算领域的长期积淀,在算力资源、服务水平、运维保障、行业应用等方面专业优势突出,平台算力网络体系完善,算力资源丰富。在此基础上,平台采用融合架构设计,以“高密计算+大数据+深度学习”结合的方式,打破传统算力中心在大数据分析、人工智能训练推理领域的服务瓶颈,可以提供强劲的“通用计算+专用计算”融合算力支撑。
在算力强劲优势之外,曙光计算服务平台还通过全国数据中心的算力资源链接,实现了算力的互通互联,可以按需按量为用户进行统一调度管理,为需求侧提供“自来水”一样即开即用的算力服务。同时,平台采用远程集中运维服务进一步提高运维管理效率,实现数字化、自动化运维,在算力流通和运维两大维度上持续降低科研人员的算力使用难度和成本。
更值得一提的是,曙光计算服务平台目前已面向全产业开放了API接口,通过对接产品、商业模式、技术服务,以多中心互联的算力资源为合作伙伴赋能,实现产业生态的垂直整合。这也将在算力服务层面,为SaaS服务提供商、应用软件提供商、第三方服务商打开更广阔的服务通道,为用户实现计算服务的平台集成、应用集成和服务定制,打造出更多样化、高品质的算力服务。
随着曙光等算力供给侧厂商的服务升级,以及计算服务生态的快速发展,三维建模等科技创新领域迎来更加强劲的驱动力量。而对于长期受限于算力门槛的整个科创产业来说,曙光计算服务平台的应用落地,也意味着更多科技企业、科研院校单位的算力天花板被逐渐打破,
未来的科创产业发展图景仍在不断刷新。
好文章,需要你的鼓励
微软与三星达成合作,将Copilot人工智能助手集成到三星的智能电视和显示器产品中。用户可以通过语音或遥控器直接与Copilot交互,获得智能问答、内容推荐、设备控制等服务。这一合作标志着AI助手从传统计算设备向家庭娱乐设备的进一步扩展,为用户提供更加智能化的观看体验。
成均馆大学团队开发出选择性对比学习新方法,让机器通过观察人类交互场景学会识别物体功能部位。该技术突破传统局限,采用动态学习策略,能根据信息质量调整学习方式,在多个数据集上显著超越现有方法,为机器人、自动驾驶等领域的智能交互应用奠定重要基础。
在全球经济不确定性增加的背景下,AI创新竞赛正在加速进行。但许多企业仍缺乏执行工具:Gartner预测到2027年,60%的组织将因数据治理问题而无法实现AI用例的价值。企业需要统一的数据平台支持所有数据模型,建立可靠的AI就绪数据管道,并通过主权AI工厂标准化AI流水线。通过集成向量数据库、嵌入管道和模型服务,企业可将生产就绪应用的部署时间从数月缩短至数小时,实现完整的数据主权和治理。
新加坡南洋理工大学研究团队开发出EgoTwin系统,这是首个能够根据文字描述同时生成第一人称视频和匹配人体动作的AI框架。该系统通过创新的头部中心动作表示方法和因果交互机制,解决了视角对齐和动作画面同步的核心难题,在17万样本的真实数据集上实现了显著性能提升,为VR内容创作、影视制作等领域提供了新的技术可能。