近年来,随着数字经济飞速发展,特别是大模型所带来的生成式AI能力涌现,对算力需求越发旺盛,智算中心开始崭露头角。
ChatGPT的出现让生成式AI领域再度热闹起来,相关大模型产品如雨后春笋般涌现,随之而来就是,对算力需求的快速增长。
仅以GPT-3为例,GPT-3.5的训练使用了微软专门建设的AI计算系统,由1万个V100 GPU组成的高性能网络集群,总算力消耗约3640 PF-days,即假如每秒计算一千万亿次,需要计算3640天。
根据GIV的预测,到2030年,通用计算算力(FP32)将增长10倍,达到3.3 ZFLOPS。而AI智算算力(FP16),将增长500倍,达到105 ZFLOPS。
面对如此庞大规模的训练任务,智算中心作为一种新型基础设施,开始发挥着越来越重要的作用。
什么是智算中心?
那么,什么是智算中心呢?
所谓智算中心,指的是人工智能计算中心,是基于最新人工智能理论,采用领先的人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的公共算力新型基础设施,通过算力的生产、聚合、调度和释放,高效支撑数据开放共享、智能生态建设、 产业创新聚集,有力促进AI产业化、产业AI化及政府治理智能化。
据中信所《人工智能计算中心发展白皮书(2021)》指出,一个国家的计算力指数每提高1点,数字经济将增长3.5‰,GDP将增长1.8‰。由此可见,智算中心对于国家经济的影响也是非常显著的。
值得一提的是,近年来,国家出台了多项智算中心相关政策,推动智算中心建设。例如:《新型数据中心发展三年行动计划(2021-2023年)》明确用三年时间,基本形成布局合理、技术先进、绿色低碳、算力规模与数字经济增长相适应的新型数据中心发展格局;《“十四五”国家信息化规划》提出加强信息技术专利创新,围绕 5G、人工智能、量子信息、区块链、物联网、工业互联网、大数据中心、智能计算中心等领域加强高价值专利培育;《“十四五”数字经济发展规划》提出,要推动智能计算中心有序发展,打造智能算力、通用算法和开发平台一体化的新型智能基础设施。
数据显示,截至2023年8月,我国已投入运营和在建的智算中心分布在北京、上海、南京、杭州等多个城市。其中,上海的智算中心数量为5个;江苏和浙江紧随其后,均有4个;广东排名第三,布局有3个智算中心。
大模型将如何影响智算中心?
实际上,大模型的飞速发展也将对智算中心提出更高的要求,具体来看:
第一,计算资源需求增加。随着大模型的规模不断扩大,对计算资源的需求也在不断增加。智算中心需要提供更强大的计算能力来支持大模型的训练和推理任务。
第二,存储需求增加。大模型需要大量的存储空间来存储参数、权重和中间结果。智算中心需要提供高效的存储系统来满足这些需求。
第三,数据传输和通信压力增大。大模型的训练和推理过程中会产生大量的数据,需要进行频繁的数据传输和通信。智算中心需要具备高速的网络连接和大规模的数据传输能力。
第四,能源消耗增加。大模型的训练和推理过程需要大量的计算资源,导致能源消耗的增加。智算中心需要采取节能措施,如使用高效的硬件设备和优化算法,以降低能源消耗。
第五,模型管理和调度复杂性增加。大模型的训练和推理过程需要进行复杂的模型管理和调度,包括模型版本控制、并行训练和推理等。智算中心需要提供相应的管理和调度工具来支持这些任务。
第六,安全和隐私问题突出。大模型的训练和推理过程中可能涉及敏感数据和隐私信息,需要加强安全保护措施。智算中心需要建立完善的安全机制,确保数据的安全性和隐私性。
第七,人才培养和技术更新需求增加。大模型的发展需要具备相关技术和知识的人才支持。智算中心需要加强对人才的培养和技术的更新,以适应大模型的需求。
可以说,伴随着大模型落地深入发展,智算中心需要不断提升自身的能力和技术水平,以满足大模型的需求。
写在最后:
根据IDC联合多方发布的《2022-2023全球计算力指数评估报告》预测,全球AI计算市场规模将从2022年的195.0亿美元增长到2026年的346.6亿美元。其中,生成式AI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元。显然,巨大的算力需求将引发智算中心的建设热潮。
未来,智算中心将朝着怎样的方向发展?让我们拭目以待。