节能降碳专委会成员:梁宇栋范世兴黄超胡东帅
摘要:算力中心基础设施的数字孪生技术,是基础设施生命周期和信息世界交互的有效方法,近年来受到了国内外学术界和企业界的高度关注。算力中心数字孪生技术通过高精度建模、实时数据交互和智能仿真优化,为算力中心的精准设计,高效率高质量建设,能耗管理及故障预测提供了新的技术路径。本文基于对算力中心基础设施数字孪生的概念内涵、系统架构、运行机制及关键技术的研究与实践,探讨了其在算力基础设施设计,建设与运行优化中的核心作用。设计了算力中心数字孪生建设模型的参考系统架构,为企业算力中心数字孪生仿真建设实践提供了参考。
关键词:算力中心基础设施;数字孪生;能效仿真;施工管理;运维优化
中图分类号:
文献标志码:
引用格式: 梁宇栋,范世兴,胡东帅.算力中心基础设施全生命周期数字孪生理论与技术研究
数据作为数字经济时代的关键生产要素,逐步融入生产生活各方面,深刻影响并重构着经济社会运行和社会治理,全领域、全方位、全过程数字化转型已成为数字经济时代发展主旋律。
数字孪生(Digital Twin)技术通过构建物理实体的虚拟映射,结合实时数据交互与仿真优化,为算力中心的智能化建造与管理提供了新的解决方案。国内外政府高度重视数字孪生技术的发展,并出台多项政策推动其应用。例如,中国《“十四五”数字经济发展规划》明确提出推动数字孪生技术在智慧城市、工业互联网等领域的深度融合。美国国家标准与技术研究院(NIST)在《数字孪生制造框架》中强调了数字孪生在智能制造中的关键作用。欧盟《2030数字罗盘计划》也将数字孪生列为未来数字基础设施的核心技术之一。
在算力中心领域,数字孪生技术能够实现从物理世界到虚拟世界的实时映射,支持设计仿真,建设管理与运行节能优化与健康预测,从而提升整体算力中心上线效率、质量与运营效率。
国内外学者和实践者围绕算力中心数字孪生技术开展了一定研究和建设工作,包括BIM,AR/VR等,提出很多有价值的理论和技术,从不同角度对园区,楼宇建筑,算力中心内部子系统等层面进行了分析,并提出了相应的解决方案。但在设计建设和运维运营等方面仍存在局限和不足:
(1)设计阶段:研究主要采用BIM技术,实现3D可视化设计,避免管线、设备、建筑结构之间的碰撞。在一定程度上减少设计问题。但当前主流设计工具多为国外单机软件,各专业协同不足。研究也主要集中在几何模型中,设备只具备空间属性,对运行状态数据缺少模拟,尤其缺少综合考虑IT系统对基础设施运行影响。
(2)交付阶段:采用AR/VR等技术进行虚实结合,但应用场景落地性不足,主要围绕远程指导,模拟培训等场景,缺少综合考虑人-设备-环境等多种要素的研究与系统功能。
(3)运维运营阶段:算力中心的建模/仿真/分析方面主要依赖已有数据驱动模型进行,对系统的工况、规则、约束等因素,以及实时动态数据集成考虑不足。
以上不足可归纳为算力中心物理信息与机理模型结合问题;针对该问题,行业内、高校、研究所等各技术研发组织不断年将数字孪生技术引入到算力中心设计与建设中,探索了智慧工地,智能建造,AI节能等方案。
本文提供了算力中心基础设施全生命周期数字孪生技术的最佳实践和参考,设计了如图1所示的算力中心建设数字孪生系统参考架构,该架构主要包括3层:①物理层,主要指算力中心制冷设备,供配电设施,IT机柜等物理实体,以及物理设备对应活动的集合,负责算力中心的物理空间实现,同时具有感知、决策、底层数据采集与传输等功能;②数字孪生引擎层,指算力中心孪生仿真服务平台,负责为算力中心的物理空间、虚拟空间和服务系统运行提供数据支撑与模型服务,并具备算力中心孪生数据的生成、处理、集成、融合等生命周期管理与处理功能;③数字孪生服务层,负责为算力中心提供能效设计,BIM协同设计,施工质量管理、隐患预测、能耗优化等各类服务。
图1 数字孪生系统参考架构
构建算力中心数字孪生仿真模型,需要经过以下过程:
• 首先需要收集算力中心相关的数据,包括设施运行数据、环境配置数据、各类性能数据、空间数据等;
• 将收集到的数据通过数据仓库进行加工,建立多维多层模型,基于模型驱动生成系统架构;
• 每一时刻多维信息都会自动留存快照,记录基础设施现状和历史,支持历史按需回放,并可支持不同历史时刻快照对比,直观呈现系统运行变化趋势;
通过构建简单、易用、轻量级的数据底座,在整个设计、建设、运维和优化的服务过程中提供基础能力保障。
数字孪生引擎主要围绕数据、建模、仿真、可视四个方向,构建数字孪生引擎核心能力。
数据中心基础设施相关数据是海量的,包括配置、路径、策略、流量等多层异构数据。数字孪生引擎会采集这些数据,并对多源数据进行全量映射后发布主题数据。通过开放的数据采集框架,可以灵活的对接外部三方系统进行数据的自动采集和同步,并进行数据的清洗和加工,消除过滤冗余和冲突数据,最终将多源数据全面映射成唯一ID,形成数据资产,提供带标签的数据集,支持算法验证。
孪生建模是数字孪生引擎中最核心的能力,也是数字孪生能否发挥价值的重要指标。大规模组网的海量数据。建模的目标主要是支撑基础设施规建维优营的全生命周期和全场景自动化,所以需要针对不同的场景匹配不同的模型,核心的关键模型如下:
• 优化类模型:提供架构规划、性能提升等问题的确定解析框架;
• 拟合类模型:突破统计、数理分析、AI关键技术,实现时序KPI拟合类建模;
• 资源模型:构建ID、协议、控制表资源模型,实现资源自治;
孪生仿真是基于形式化建模技术,通过构建大规模虚拟环境执行仿真评估,实现模型运行、校验,支持事件响应、状态数据传递等数字孪生虚拟环境仿真系统构建。孪生仿真解决了大规模复杂系统、应用的业务抽象建模及高还原度在线运行问题,以及形式化仿真验证技术在实际业务中的可靠性和准确性问题。
仿真的价值在于通过模型双向映射及形式化建模仿真等技术,实现复杂规模系统下的仿真及业务评估,零风险、低投入实现SLA保障;通过形式化仿真工具及模型校验技术,构建系统模型及模型实例双向映射孪生仿真基础机制,实现重保应用对应的组网/路径/应用数据大规模仿真。
孪生可视主要目标是解决最终用户的数据使用体验,通过可视化的方式将内部建模后的多维数据进行综合可视。
孪生可视基于模型驱动自动生成系统架构,基于智能布局快速还原物理拓扑结构,帮助服务人员快速识别系统、设备特征,提升服务效率。同时,每一时刻多维信息都会自动留存快照,记录算力中心规划,现状和历史;支持历史按需回放,并可支持不同历史时刻快照对比,直观呈现系统多维变化趋势。
在设计阶段,无法通过测试直接获取智算中心的能效,但必须保证设计能效满足标准要求。基于对业务和物理机理的理解,将基础设施各种设计数据进行整合和关联,构造即反映系统特征又符合系统研究要求的模型,并在该模型上进行所关心的系统能效的研究,揭示系统的内在特性、运行规律、分系统之间的关系并预测未来,从而让使用方可以快速的获取到算力中心的能效预测结果,为企业或使用方提供仿真数据,更精准的了解方案投产后的结果。
能效仿真设计建模和模拟过程如下:
1) 设备建模:基于设计方案和选型,构建主设备机理模型,关联工况曲线、换热器参数、部件性能参数等。
2) 系统建模:基于方案设计,以及系统图建立系统架构关系,形成系统级的联动运行模型。
3) 空间建模:基于设计方案,建立构建数据中心系统的三维空间模型,明确主设备位置关系,构建管线系统3维空间信息。定义IT系统负载与末端空调冷量关系,支持进行一维(系统)和三维(空间)仿真关联仿真。
图2 数据中心仿真模型示意
4) 注入环境等外部因素,设定仿真起始点:完成系统建模和关联后,注入外界环境参数(气候数据、环境)、仿真设定点(温湿度设计值、空调控制模式、IT负载情况、仿真起始状态),设定仿真起始状态。
图3 PUE仿真参数设置
5) 系统级仿真结果模拟:系统进行仿真运算并输出不同时间段(全年、月、天和小时级)下的PUE仿真值。系统按全年小时级,仿真设备和系统运行状态,基于PUE模型进行卷积,计算小时级系统能耗。基于小时级能耗,卷积天度,月度、年度PUE值。
图4 PUE仿真结果逻辑
图5 PUE仿真结果展示
可视化展现项目的各系统、组件。根据需求按楼栋、楼层、专业分层级展示BIM模型,提升加载速度和展示体验,精确呈现各系统、组件的设计及部署信息,并在模型中实时监控现场情况。
可视化展现各系统、组件的交付进展。通过对模型构件按未开始、施工中、已完成、延期施工等各个阶段设置不同的颜色,不同阶段模型对比明显,可视化展现各系统、组件的交付进展,可实现施工进度形象化展示,快速直观了解施工进度情况,
图6 3D模型施工进度展示
优化施工工序,减少并行施工问题。通过将BIM模型与施工进度计划相链接,可以直观、精确地反映整个施工过程。施工模拟技术有助于在项目实施过程中合理制定施工计划、精确掌握施工进度、优化使用施工资源以及科学进行场地布置,对整个工程的施工进度、资源和质量进行统一管理和控制,以缩短工期、降低成本、提高质量。
对现场施工安全,在3D BIM模型中,结合摄像头部署配置,支持在模型中实时监控现场EHS风险,识别人员是否穿戴荧光衣,安全帽,并发现火焰,烟雾等风险。图7 3D模型结合安全监控。
图7 3D模型结合安全监控
在运行阶段,结合数据处理算法,建模经验以及暖通与IT系统知识沉淀生成AI模型。建模过程应充分考虑专家经验,提升建模效率与系统安全性,并能结合仿真数据覆盖更多场景,提升模型覆盖范围与节能效果。
优化模块对数据中心进行能耗建模,构建关键特征值与数据中心能耗之间的关系,并进一步随环境变化进行推理和运行寻优,让IT系统与暖通系统中各设备运行在优化的工况参数下,可以有效降低算力中心整体能耗。
图8 3D模型结合运行功耗
图9 推理寻优建议
优化模块主要包含数字化仿真调优模型、数据治理及模型训练、模型推理和安全保障系统。针对数算力中心液冷场景中的制冷方案,通过融合流体仿真和控制仿真技术,结合环境变化、IT负载模拟,建立制冷系统和配电系统,IT设备的计算节点的仿真模型,实现算力中心能耗的模拟预测,精准呈现,支撑调优策略落地。
算力中心数字孪生技术通过基础技术构建,和应用层面的持续创新,其特点体现在:1、可将两者无缝集成和结合。例如,能效仿真可通过算力中心的模型实例与仿真数据的融合,直观呈现数据中心全年小时级PUE指标及设备工况数据,并实现设计能效自动化运算,从而实现精准设计。当然,数字化技术的应用过程会随着新数据的持续加入不断迭代更新。/2、提供的一致的数据模型,仿真模型/AI算法模型不仅可以运用在一个数据中心,随着各类能力的持续沉淀,也可以应用于未来的算力中心建设与维护优化。对当前企业来说,成功的孪生技术可以迅速有效地助力业务数字化转型,使企业适应和实现互联网+与人工智能时代演进。
面向未来,要以整体性系统性思维为导向,将数字孪生融入算力中心建设的数字化转型中。
Ø 在技术上,加强AIGC、AI 大模型应用,助力数字孪生引擎的构建;
Ø 在应用上,深化仿真推演和机理模型构建;
Ø 在数据上,以数字孪生资产推动数据要素有序流通和价值化;
Ø 在产业发展上,以标准互认、平台兼容、能力融合、生态合作等,促进产业竞合关系进一步调整,实现数字孪生技术在各领域的广泛应用和发展。
在国家政策要求下,要以整体性系统性思维,将算力中心数字孪生仿真融入国家数字化转型建设中。一是以总体设计方法论,谋划数字孪生的技术架构、业务架构、应用架构、数据架构和组织架构。算力中心数字孪生引擎是体系工程/系统工程(System of System)。 需要以算力集群发展愿景为目标,理顺需求方、集成商、项目实施方等多相关方协同合作关系,设计业务架构、应用架构、数据架构、技术架构等,组织系列工程项目建设,确保数字孪生整体性落地。二是夯实数字化共性基础,统筹推进数字孪生各类基础能力建设。推进功能整合、协同发展,复用其数据与能力,为算力中心数字化转型提供统一的时空框架,包括空间数据、建模仿真等能力,因地制宜有序探索推动虚实共生、仿真推演、迭代优化的数字孪生场景落地。
从产业视角,加强标准互认、平台兼容、能力融合、生态合作等,促进产业竞合关系进一步调整。
一是加快标准互认。通过制定和推广统一的行业标准,可以打破数据壁垒、技术壁垒、行业壁垒和国际壁垒,促进数据和模型的共享,从而加速技术创新和应用的普及。
二是促进平台兼容与能力融合。多平台打通或兼容则能够允许不同来源的数字孪生能力在多样化的技术环境中无缝集成,增强了解决方案的灵活性和可扩展性。
三是加强生态合作。通过构建开放的生态系统,鼓励不同参与者之间的合作,可以激发创新,共同解决复杂的行业挑战,创造更大的社会和经济价值。
参考文献
[1] 计算机集成制造系统 . 数字孪生车间信息物理融合理论与技术(2017 年)第23卷第8期 陶飞,程颖等.
[2]华为云计算技术有限公司.中国信通院数字孪生发展研究报告(2024年6月)
[3]华为技术有限公司. 中数智慧信息技术研究院. 西安交通大学能源与动力工程学院.数据中心PUE技术白皮书(2022年)陶文铨,钟景华,梁宇栋等
Research on Digital Twin Theory and Technology for the Full Lifecycle of Data Center Infrastructure
From Energy Saving and Decarbonization Special Interest Group of GCC:
Liang Yudong, Fan Shixing,Huang chao,Hu Dongshuai
Abstract:The digital twin technology of data center infrastructure is an effective method for the interaction between the infrastructure lifecycle and the information world, and it has received significant attention from both domestic and international academic and business communities in recent years. Through high-precision modeling, real-time data interaction, and intelligent simulation optimization, the digital twin technology of data centers provides a new technical path for precise design, efficient and high-quality construction, energy management, and fault prediction. This paper explores its core role in the design, construction, and operational optimization of data center infrastructure based on research and practice of the concept, system architecture, operation mechanism, and key technologies of digital twins in data center infrastructure. A reference system architecture for the construction model of data center digital twins is designed, providing a reference for the practical simulation construction of enterprise data center digital twins.
Keywords: Data Center Infrastructure; Digital Twin; Energy Efficiency Simulation; Construction Management; Operation and Maintenance Optimization.