中国信通院云大所所长:解读算力网络与算力中心

Connor 抹茶中国 2024-03-26 43 0

作者介绍

何宝宏,现任中国信息通信研究院云计算与大数据研究所所长,中国通信标准化协会互联网与应用工作委员会主席等,著有《数字原生》《互联网的基因》《风向》等图书。

网络有广义的,也有狭义的。要手上做着狭义网络的工作,心里想着广义网络的机遇。

广义网络千万种,大致三类。自然界中,真菌的菌丝网络、植物根系、蜜蜂等昆虫的社群网络,淋巴系统、神经网络和蜘蛛网等。人造原子世界中,渔网、贸易网、交通网和神经网络等。人造信息和数字世界中,电话网、互联网、物联网、社交网络和深度学习网络等。

建立网络是为了彼此合作,信息传递和资源共享。包括生物体之间的,非生物之间的,以及生物体与非生物之间的(人机交互,如脑机接口和提示工程)等。同质间的叫NNI(网络-网络接口,彼此对等信任多点),异质间的叫UNI(用户网络接口,彼此是甲乙方关系)。

通信行业理解的网络,是最大限度地让信息入网和出网时保持一致(只传递,不改变)。典型做法是三段式:建立通信连接、传递信息和关闭连接。

计算机行业连接的网络,虽然与通信行业是一致的,但在具体做法上有不同理解。比如,在传递信息前可以不先建连接,传递出现错误或拥塞时网络不一定要负全责(比如通过应用层重传)等。更具体的体现,是在传统通信技术(如电话网)与互联网的区别,在于网络与终端之间的分工原则不同。

到了AI时代,神经网络中的“网络”,与通信网络和计算机网络中的”“网络”,区别更大:出网络的信息与入网络的信息完全不同,是产生了新价值的信息。此网络非彼网络,原来的网络是对信息的远距离COPY,现在的网络是对信息的深层次加工。

对于算力网络,计算机界的关注重点依然是计算,核心是算力的生产和控制。多在一个数据中心范围内,在一个管理实体内,偏技术。在一个相对较小的可控范围内,如何借助网络的力量,通过技术创新和控制更好地提供算力资源。

对于算力网络,通信界的关注重点依然是连接,核心是算力的管理和调度。多是在跨管理实体的,是在广域的大网,偏商业。在全国甚至全球范围内的多实体之间,如何借助网络的力量,通过协同和商业更有效地共享算力资源。资源的共享和利用,更强调差异化算力供给之间的协同和管理、资源编排,强调数据应用需求与算力供给之间的映射和匹配。

对“三网融合”,可以有三种理解。一是指早年的“电话网、广电网和计算机网“的融合,二是指当下数据中心内的”通信技术、存储技术和计算技术“的融合,三应该会是未来”互联网、算力网和电力网“的融合。

计算机实现了算力单元之间的无缝连接,互联网实现了计算机(包括手机)和局域网的互联。算力网络也要实现数据中心内的互联,实现数据中心之间的互联。而数据中心,就是计算机。

计算机和传统局域网技术,主要针对的是算力消费侧。数据中心和数据中心(内)网络,主要针对的是算力的供给侧。

算力网络发展的第一阶段是云网协同,如SDN/NFV技术等,是把云计算技术应用到网络中去,是行业的共识。但说第二阶段是算网融合,在中国的国情下只能是电信运营商的路径,没有自己网络的云服务商依然是协同的问题,只有同一实体才能谈融合,不是一家人不能进一家门。

云计算兴起时,热的是“云“服务模式不是”计算”。云计算是算力服务化的起点,把算力从第二产业升级为第三产业了,但现在看也只是算力服务一种方式。云计算协同了网络,就有了边缘计算的概念。云计算有了深度学习和大模型,就有了智算。因此,现在算力、智算和算力网络的流行,是在弱化云的模式而强调算的本质,算力服务本身多元化了。

如果说数据中心就是计算机,那么云计算就是个数据中心级的操作系统。

应该把数据中心改成“算力中心“。之前叫机房强调是放计算机的房子,后改名叫数据中心强调主责是存储数据(磁带、光盘和服务器)的地方,但现在核心任务是提供算力资源和服务了。

算力供给以摩尔定律的速度的增长,但数据的增长已经快于算力了(年增长50%),但AI大模型对算力的需求每3-4个月翻倍。

一个是数据要素,一个是算力网络,欧美还没有类似的概念,我们在摸索中创新,在创新中前行。

作者丨何宝宏

来源丨公众号:何所思(ID:gh_9820d1a2e9ef)

dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn

评论