近日,工业和信息化部、国家发展改革委、教育部、财政部、中国人民银行、税务总局、金融监管总局、中国证监会发布了《关于加快传统制造业转型升级的指导意见》(以下简称“《指导意见》”),提出要探索建设区域人工智能数据处理中心,提供海量数据处理、生成式人工智能工具开发等服务,促进人工智能赋能传统制造业。
什么是人工智能数据处理中心?它要解决何种问题?哪些企业、机构会承接数据中心的建设?
从具体概念来看,数据处理中心、数据中心和算力中心在概念和功能上有相似,也有不同。一般来说,算力中心强调计算能力,数据中心注重存储能力。多位受访专家告诉21记者,实践中这些中心往往都兼具这两种功能。换言之,这个政策里提到的数据处理中心和算力中心、数据中心在实际用途上应该有相似之处。
而其中提到人工智能数据处理中心的核心目的,可能是解决AI三驾马车——算法、算力、数据中的算力问题。算力可以分为通用算力、智能算力、超级算力三大类,各类数据中心或计算中心的设计、建设布局,都有各自的差异化、有针对性的功能作用。
其中,智能算力及相应的算力中心主要针对的就是人工智能技术的研发和支持。数字经济领域的一名研究者向记者表示,从此次发布的《指导意见》中描述的功能——“提供海量数据处理、生成式人工智能工具开发等服务”来看,人工智能数据处理中心可能主要将支持大模型的发展。
“人工智能数据具有一些独特的特点,这些特点使得建立专门的数据处理中心成为必要。”天使投资人、人工智能专家郭涛指出,首先,人工智能数据通常具有高度复杂性和多样性,需要大量的计算资源和算法来进行处理和分析。其次,人工智能数据的处理过程通常涉及到隐私保护和安全问题,因此需要一个专门的机构来负责管理和监督。最后,人工智能数据的处理和应用需要跨学科的知识和技能,包括计算机科学、数学、统计学、经济学等领域的综合运用。
随着人工智能在科技产业的影响力逐渐提升,近年来,国家已出台多项智算中心相关政策。
2021年发布的《新型数据中心发展三年行动计划(2021-2023 年)》提出加快高性能、智能计算中心部署;《“十四五”国家信息化规划》则提到,要建设面向人工智能等的算力和算法中心。2022年的《“十四五”数字经济发展规划》进一步提出,将推动智能计算中心有序发展,打造智能算力、通用算法和开发平台一体化的新型智能基础设施。就在刚刚过去的12月,五部门联合印发的《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》中也为智能算力发展设立了目标。文件提出,加快实现智能算力资源供需平衡,提升智能算力在人工智能等领域适配水平等。
可以预见的是,在新一轮的AI浪潮下,针对性的智算服务即将迎来增长空间。根据21记者不完全统计,截至目前,包括深圳、南京、成都等多个城市都建设运行了城市智算中心,为本地产业数字化转型、培育新兴产业(包括大模型)等提供算力支持。
今年清华大学全球产业研究院发布的一份《2022-2023全球计算力指数评估报告》预测,到2026年,生成式AI计算市场规模将从2022年的8.2亿美元增长到109.9亿美元,占整体AI计算市场的比例将从4.2%增长到31.7%。AI高歌猛进,也对数据中心带来诸多挑战。
一个变化是云厂商的入局加速。信通院2022年《数据中心产业图谱研究报告》指出,我国数据中心市场目前以三大运营商为主导——即中国电信、中国联通、中国移动。对于基础运营商,布局早,具有更多的客户、网络、土地资源掌握权和行业话语权,在数据中心行业具有先天优势。但上述研究者也表示,“目前和未来,数据中心的主要客户市场在人工智能领域。”
从2021年、2022年公布的53个国家新型数据中心典型名单可以看到,一半左右的大型数据中心由三大运营商申报,但阿里云、百度云、华为云计算数据中心也已名列其中。以人工智能为主要客户的云厂商,越来越多地加入数据中心的核心建设环节。
郭涛告诉记者,针对人工智能的开发和训练建设算力中心,早已有了基础土壤。比如在第一波人工智能浪潮时,各个城市建立的人工智能计算中心,通常就包括了公共算力服务、应用创新孵化、产业聚合发展、人才培养四类平台,对上中下游的产业有很强的带动作用,新的人工智能数据中心可以视为它们的延续。
在生成式AI热潮催生高性能算力需求的当下,亚马逊、微软和谷歌在内的全球云厂商,都在竞相满足生成式AI的爆炸需求,不断加码对底层数据中心的投入。
值得一提的是,除了云厂商,钢铁和房地产企业这几年也正涌入数据中心的建设。上述《数据中心产业图谱研究报告》指出,宝能、南钢股份、杭州钢铁集团、沙钢集团都曾布局数据中心,希望促进云计算应用和产业发展的深度融合,加速区域产业结构升级。
另一个挑战则是数据中心自身的形态。对于AI数据,通常需要更多的计算能力和数据存储能力。微软的云数据管理者此前在采访表示,人工智能数据中心需要的电力大概是传统云设施的三倍。
一个生动的例子是,常规云数据中心的需求是不断波动的。举例来说,对于常规数据中心,当大部分用户入睡后,使用率就会下降;相比之下,训练大模型的人工智能数据中心往往需要持续运行,因此更多的电力、更特殊的冷却系统,通常是这类数据中心特别需要的。
郭涛还补充,“传统的数据中心主要关注于存储和管理数据,而人工智能数据处理中心则更加注重数据的分析和挖掘,以及基于数据分析结果的决策支持。此外,人工智能数据处理中心还需要具备更强的创新能力和技术实力,以满足不断变化的市场需求和技术发展。”
对此,同济大学法学院副教授陈吉栋表示:“建设人工智能数据处理中心,提供海量数据处理、生成式人工智能工具开发等服务,不仅是对当前产业转型升级的推动,也是对未来技术发展的积极响应。可以看到我们在跨越一个新的技术门槛。”