大模型时代的基础架构:大模型算力中心建设指南
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

推荐序三

方老师邀我为本书作序,实话实说我很惶恐,毕竟我的教学和研究领域与大模型领域并不完全契合。拿到本书后,拜读数次,觉得还是有些话要说,不当之处还请作者和读者海涵。

我从计算机专业的学生成长为勤耕不辍的教师,方老师从风华正茂的IT青年成长为计算机领域的资深专家,可以说,我们是相识、相知较深的朋友。方老师时常迸发的对技术发展趋势的真知灼见,总能让我感受到他对计算机前沿不懈探索的热忱。近年来,方老师在其微信公众号上连载的技术文章,让人对相关领域的技术发展趋势有了清晰的认知。可以说,他是一名很好的计算机领域的科普作者,是懂得如何用深入浅出的语言让读者领会深意、学通知识的。

在“博世互联世界2024”大会上,埃隆·马斯克远程接受了博世CEO斯特凡·哈同和董事长马库斯·海恩的采访,就人工智能议题发表看法。他认为,人工智能的快速扩张将导致电力供应紧张。我认为,这种令人担忧的情况恐怕会很快出现。大模型“适时”地出现在了人类科技的工具箱里,当我们沉浸在一个个表现优秀的神经网络模型中,看到一个个大模型、超大模型快速升级、迭代时,我们是否忽视了大模型算力本身的架构是如何搭建和运作的,乃至从绿色节能的角度是如何调节和调度的呢?不用犹豫,我们的确忽视了。

算力中心作为大模型基础架构,在其搭建过程中,除了大模型本身性能是否优异的问题,如何对与之关联的硬件进行部署、对硬件计算能力进行优化和提升,已经是绕不过去的突出问题。本书恰恰从这个角度给出了相应的解决方案,而且呈现的形式不是枯燥乏味的描述,而是能让读者在思考及会心一笑的状态下,了解大模型基础架构的整体形态和各子系统是如何运作的,以及是如何响应需求且充分利用平台资源的。这一亮点,在理论书籍盛行的计算机专业领域无异于一道甘泉。我真诚地希望读者能够发现本书,翻阅本书,喜爱本书。

本书的另一大亮点,可能会被人忽视,但我要提出来,那就是在本书中贯彻始终的计算机系统架构设计中的哲学方法论。我作为一名高校教师,任教数年来,深感学生,尤其是计算机专业的学生,对所学专业的认知往往停留在编程层面,不能成体系地掌握专业领域的知识结构,更遑论计算机系统架构设计中的哲学方法论。而这些哲学层面的理论缺失,往往导致学生在未来的工作领域,很难用系统工程的眼光去看待工程项目的实施,对其中蕴含的科学方法论更是无从谈起。因此,本书提及的这些哲学方法论,是对专业人员提升思维层次且强化系统认知的很好补益。

在写本序时,我一直在听歌曲Positive Outlook。在探索人工智能的道路上,我们能被智者指点迷津,从而继续奔赴星辰大海,是幸福的。本书对计算机专业领域的学生及技术工作者学习和了解大模型相关知识有很大的帮助。希望本书能收获更多的读者,也希望方老师在后续的工作中结合自己的心得,为我们写出更多、更好的著作。

江苏科技大学计算机学院 王琦