“双零行动”行动背景
在AI 技术与集群设备的发展呈爆发式增长的现在,在AI训练、大数据处理、云计算等领域对算力的需求日益增大,这使得数据中心的设备功率密度不断提升,传统的风冷散热方式逐渐难以满足当下的散热需求,液冷技术开始逐渐替代传统风冷,液冷因其高效的散热性能,成为未来数据中心散热的关键解决方案。
当前液冷技术在实际应用中面临着一系列挑战。因液冷工质的类型丰富多样,导致不同的工质在散热性能、化学稳定性、成本等方面各有差异,同时管路、接头、阀件等各类材料也有多种选择,其材质特性、耐腐蚀性、密封性能等都存在差异,更为关键的是,液冷工质与各类材料之间的兼容性问题频发,如某些工质可能会与特定的管路材料发生化学反应,导致管路腐蚀、泄漏等,这不仅影响液冷系统的正常运行,也对服务器等设备造成了严重损坏,极大地影响了液冷服务器在机房的部署效率,降低了服务器在运行过程中的可靠性。频繁出现的兼容性问题,使得数据中心的建设周期延长、维护成本增加,严重制约了数据中心行业的发展。
为有效应对这些挑战,更好地匹配AI和集群算力设备的发展需求,全球计算联盟(GCC)开放液冷专业委员会、中国电子工业标准化技术协会(CESA)开放计算标准工作委员会(OCTC)、中国电子工业标准化技术协会(CESA)新一代计算标准工作委员会和信息通信产业知识产权联盟液冷专业委员会联合发起了 “液冷机房部署零问题零等待” 联合行动,致力于达成 “部署零问题、机房零等待”,推动液冷技术在数据中心的广泛应用和高效发展。
本次行动面向液冷全产业链征集参与单位,包括但不限于液冷工质、CDU、管路、软管、球阀、快接头、分集水器、冷板、服务器、测试机构等厂商。参与单位需有成熟产品、需参与制订统一的测试方法/标准、需参与材料和工质的兼容性测试实验、需提供兼容性测试报告、客户使用出现问题后需配合定位分析等,参与单位需签署协议保证报告真实性等。
“双零行动”组织架构
双零行动运作方式简单介绍:
1. 用户首先报名参与测试,用户提出需求并由双零行动运营中心负责收集。
2. 测试Owner分析用户的需求并制定相应的测试计划,厂商根据测试Owner制定的测试计划进行测试(自测或寻找第三方测试机构)并获得测试报告,后厂商向技术Owner和测试Owner提交测试报告并由二者共同对其进行审核。
3. 审核后的测试报告由行动管理团队审批,审批后分为通过和不通过两种状态,其中不通过又分为两种情况,一种情况涉及数据质量本身不过关(即第三方测试机构或厂商自身测试实力存在缺陷),这种情况下需要对原测试数据进行再修改并再次测试。第二种涉及数据造假的情况,双零行动的行动管理团队会直接将其拉入黑名单。
4. 测试报告的审批通过后,行动管理团队会将相应厂商拉入白名单并在发起组织的官方网站上进行发布。白名单发布后,在用户使用数据的过程中运营中心会收集使用反馈,运营中心将反馈报告给技术 Owner ,技术Owner进行反馈分析并输出分析结果报告到行动管理团队进行再审批。
需要注意的是整个运作过程中要求各单位制定并签署协议从而保障测试报告的真实性,保护数据隐私等。测试方案由行动管理团队的技术 Owner 牵头制定,同时对于测试机构/厂商还要制定相应的测试资质要求,对测试机构/厂商进行资质的审查认证并公布。