11月7日,2025全球计算大会(CGC2025)在深圳隆重召开。大会以“筑新基·赋新能,拥抱AI新机遇”为主题,特邀6位中外院士领衔,40余位产业高端专家、10余位国际嘉宾等超1000位全球计算领域政产学研用各界精英共襄盛会,全方位搭建技术交流、成果展示与产业合作的高端平台。会上,全球计算联盟GCC战略咨询委员会(SAC)委员、欧洲科学院院士、苏黎世联邦理工学院教授Torsten Hoefler作为重磅演讲嘉宾带来《Entering the Age of Computation with LLMs and Reasoning Language Models》主题演讲。
其次是量化技术(QUANTIZATION),通过减少参数存储所需比特数提升效率。Torsten教授与合作者通过GPTQ (Accurate Post-Training Quantization for Generative Pre-trained Transformers)成功将模型精度从32比特压缩至4比特,接近人类大脑4比特的运行精度,实现近10倍的压缩效果,大幅降低存储成本。
最后是并行系统(PARALLEL SYSTEMS),聚焦于硬件与网络的成本优化。通过构建高效的并行计算架构与网络,实现机器成本降低10倍,三者协同作用最终达成上千倍的 AI 效率提升,让大型语言模型(LLMs)在便携式设备上的广泛应用成为可能。