3月17日,全球计算联盟(GCC)与中国电信联合举办“异构算力协同”专题研讨会。会议聚焦一个产业界非常关注的问题,如何让不同的算力系统高效协同。来自运营商、整机厂商、芯片企业、基础软件公司和服务商的专家,围绕标准、混训混推、CPU+XPU融合、软件底座和调度运营等展开了集中讨论。

中国电信研究院研究专家孙梦宇博士表示,大模型和智能体快速发展后,未来算力仍将长期供不应求,因此在持续建设新算力的同时,更要把现有异构算力真正盘活。中国电信给出的思路是搭建“统一计算、统一通信、统一调度、统一评测”的体系,并推出四芯混训和异构推理方案:四种异构芯片打通后,跨芯片网络性能提升30%,异构通信效率超过98%,训练效率达到同构集群的95%左右。

神州鲲泰信创生态解决方案负责人高洪福先生从整机侧分享了异构计算的落地难点。神州鲲泰定位为创新智算基础设施提供商,其KunTai R624 K2大模型训推一体服务器基于鲲鹏平台,最多支持10张AI加速卡,兼容多种主流AI加速卡和框架,回应了客户“灵活插卡、按需扩展”的现实需求。他也提醒,异构真正难的不是把卡装进同一台机器,而是硬件开放程度、软件开源状态和生态兼容性叠加后带来的复杂度与不确定性,因此互联标准、软件抽象和生态协同必须同步推进。


希奥端(深圳)计算技术有限公司首席研究员陈亮博士把视角放在“AI智能体时代CPU+XPU如何重新分工”上。作为一家以ARM服务器CPU为主力产品的公司,希奥端面向企业和边缘计算提供通算与智算兼顾的方案。他认为,进入智能体时代后,CPU不再只是配角,许多任务编排、工具调用、数据搬运和系统控制都需要CPU承担,因此CPU与XPU必须从“各干各的”走向更深层的协同融合,而互联、统一内存和数据安全会成为这一阶段的关键门槛。

北京中科加禾智能科技有限公司研究专家臧路先生则把焦点放在“软件底座”上。中科加禾认为,AI基础设施软件是连接上层应用和下层算力的“软底座”,不仅决定大模型训练和推理的性能上限,也决定多种硬件能否被真正用顺手。面对硬件多样、编程复杂和系统协同成本高的问题,臧路提出“以编译破局”的思路,通过SigInfer推理引擎和AI for Compiler等方式,把过去高度依赖人工经验的适配和优化流程尽量自动化,让异构算力从“能跑起来”走向“稳定、高效、可复制”。
北京清程极智科技有限公司技术生态VP何万青博士的发言更强调开源与智能体软件栈的价值。何万青介绍,清程极智正在构建面向异构算力的一体化方案,并希望在国产芯片基础上做出不逊于国际主流方案的体验。在他看来,异构协同不能只靠堆硬件,还要靠开源生态、智能路由、自动优化和安全沙箱把系统真正打磨好;特别是智能体兴起后,软件会越来越像“会自己调度资源的总控室”,把复杂底层能力尽量屏蔽给用户。

杭州天宽科技有限公司产品经理王若冰女士则从服务运营角度给出了另一种观察。作为国内领先的数智化服务运营商,天宽提供数据治理、模型开发、性能调优等多维度能力。她指出,最迫切需要异构调度平台的,往往是三类客户:不愿被单一厂商绑定的央国企和大型行业客户、拥有多种设备和多课题组的高校科研机构,以及要面向多客户多业务运营的城市算力中心。用统一平台把多厂商算力纳管起来,让用户侧“无感使用”,是天宽关注的核心需求。

在自由研讨环节,讨论转向了“全行业下一步该先解决什么”。主持人全球计算联盟秘书处CTO苗福友提出的核心问题很明确:异构算力为什么非做不可、当前最卡脖子的痛点到底在哪。与会嘉宾普遍认为,驱动异构协同的根本原因,一方面是大模型、推理和智能体应用持续拉高算力需求,另一方面是现实中客户采购的芯片、服务器和软件栈越来越多样,把已有的资源高效用好。

围绕芯片和硬件,讨论的焦点集中在“接口怎么通、设备怎么协同、能力怎么评估”。多位嘉宾提到,当前异构算力最现实的难题,不只是硬件性能差异,而是不同芯片之间接口不统一、互联方式不一致、测试认证口径不相同,导致用户在选型、部署和扩容时成本很高、风险也很高。现场形成的共识是,下一步要从接口标准、互联规范、测试认证和软硬协同几方面同步推进,逐步建立一套更统一、可比较、可验证的异构算力评价与协同框架
围绕系统软件和应用,讨论进一步深入到“异构算力到底能不能被真正调起来、管起来、用起来”。嘉宾们把问题拆成了几层:简单调度和跨厂商任务调度分别进展到哪一步,编译、推理框架、模型部署和应用层各自的主要障碍是什么,以及在主流开源系统尚不完备的情况下,厂商自有方案与新兴开源方案应如何协同。
在产业生态层面,现场的关注点延伸到“产业怎么形成合力”。有嘉宾提出,当前从应用、系统到芯片,很多需求并没有被充分说清楚,导致上游不知道下游真正需要什么,下游也难以判断不同技术路线的边界和代价,应把数据处理、安全机制、机密计算、应用落地和成本模型放在同一套产业框架中考虑。
从整场研讨会看,各家企业虽然所处环节不同,但指向很一致:异构算力协同已经不是“前沿概念”,而是AI走向大规模应用的现实工程。上游芯片企业在追求更高质量的算力,中游整机与基础软件厂商在解决兼容、适配和效率问题,下游平台与服务商则在回答“客户怎么真正用起来、用得值”的问题。
欢迎加入GCC智能计算产业发展委员会!
桂老师: guizelin@gccorg.com