详解FPGA:人工智能时代的驱动引擎
上QQ阅读APP看书,第一时间看更新

1.2 从无到有,从小到大,从大到强——FPGA发展的三个阶段

FPGA的架构一直伴随着摩尔定律不断演进,与其他类型的芯片相比,FPGA可以说是当前最先进半导体技术的集大成者。1984年,赛灵思(Xilinx)推出了第一款商用FPGA-XC2064,如图1-4所示。在这个FPGA上,只有64个可编程逻辑单元、2个3输入查找表(LUT)、总共800个逻辑门。35年后,英特尔在2019年底推出了当今世界上最大的FPGA,这款名为Stratix10 GX 10M的FPGA芯片,基于英特尔14nm工艺制造,有着433亿只晶体管、1020万个可编程逻辑单元,以及2304个可编程I/O。

图1-4 世界上首枚商用FPGA-XC2064

可以看到,在这35年间,FPGA的芯片架构发生了极其巨大的变化,用翻天覆地来形容也不为过。在这期间,有多次根本性的架构变革,它们奠定了现代FPGA架构的核心和发展方向。这些架构变革发生的根本原因,都是基于FPGA新兴应用的驱动。

前赛灵思院士,在FPGA和芯片架构领域拥有超过200项专利的Steve Trimberger博士曾把FPGA的发展历程大致划分为三个阶段,即发明阶段(the age of invention)、扩张阶段(the age of expansion)、累积阶段(the age of accumulation)。这三个发展阶段,也分别代表了FPGA技术从无到有、从小到大、从大到强的发展过程,见证了FPGA从单纯的可编程逻辑单元,逐渐发展到拥有成百上千万个可编程逻辑单元的大型阵列,再发展到集成了各类硬件资源、IP核,甚至处理器内核的复杂片上系统,并形成当前丰富的FPGA产品门类,在各类应用场景中得到越来越广泛的使用。

■1.2.1 发明阶段:历史的必然

FPGA的发明阶段横跨20世纪80年代和90年代。当时的芯片设计与生产模式与现在有着较大的不同。在当时,无晶圆厂模式尚未兴起,ASIC公司只有在客户的设计投入生产时才赚钱。然而由于开发过程中需求的变化、流片失败,或者存在无法通过固件升级进行修复的设计漏洞,往往只有1/3的芯片设计实际投入生产。也就是说,在当时有2/3的芯片项目是赔钱的。由于芯片的流片成本巨大,业界急需一种通用的半导体器件,用来进行流片前的测试、验证等工作,从而减少流片失败的可能性。在这个大环境下,可编程逻辑器件应运而生,而这也是FPGA的前身。

正如前文提到的那样,FPGA的本质也是一种芯片,它的主要特殊之处是当制造出来后,可以根据不同用户的需求,通过编程来改变自身的逻辑功能,而且这个过程可以重复进行。同时,FPGA使用固定的开发工具和开发环境,而不需要像ASIC那样开发定制化的工具链。这样一来,不同的ASIC芯片可以在流片前使用相同的FPGA进行测试和验证,这使得ASIC厂商流片前的成本和风险得到了大幅降低。

以现在的标准来看,赛灵思推出的业界第一款FPGA-XC2064更像是一个“玩具”。这个售价55美元的芯片由2.5μm工艺制造,只有64个逻辑单元,以及不超过1000个逻辑门。也就是说,实现一个简单的64位移位寄存器就会占用XC2064的全部片上逻辑。然而在当时看来,作为ASIC流片前的硬件仿真与验证平台,FPGA本身的性能并没有那么重要。此时业界需要的,只是一堆相互连接的可编程逻辑门而已。因此,XC2064的问世,在当时依然引发了不小的轰动。到了20世纪90年代,FPGA芯片的主体架构也在慢慢发展,并逐渐演变成为了现在我们熟悉的可编程逻辑阵列的结构,如图1-5所示。

图1-5 FPGA的基本架构

■1.2.2 扩张阶段:设计自动化的兴起

20世纪末是摩尔定律大放异彩的时代。在摩尔定律的指引下,半导体行业在这十几年里经历了飞速发展。与之对应的,FPGA在1992年到1999年之间迎来了自己的扩张阶段。此时由于芯片制程技术的持续突破,制造大尺寸的芯片已经不像以前那么困难了。对于FPGA来说,不断提升自身的容量就成为了自然而然的选择。FPGA包含的逻辑单元、I/O引脚、时钟和布线等片上资源的数量都在持续增加。伴随着FPGA容量的增长,曾经非常宝贵的芯片面积也逐渐变得相对廉价,这也直接影响了很多电路设计方法论的发展。例如,在此时就出现了“面积换性能”之类的电路设计方法。

更大的芯片面积也给FPGA的架构创新提供了更多的想象空间。例如,FPGA可编程单元中的LUT查找表结构,从最初的三输入,开始变成四输入和六输入,甚至更多。在这些基本的可编程单元内部,还逐渐增加了寄存器和多路选择器等更多额外功能。渐渐地,这些FPGA片上资源的互连复杂性已经开始取代逻辑结构的复杂性,并成为FPGA厂商需要优先解决的问题。

与前一个阶段相比,在扩张阶段发生的另一个主要的变化就是FPGA自动设计工具和软件的兴起。由于FPGA结构变得越来越复杂,出现了针对FPGA进行优化设计的自动综合、布局和布线的EDA工具,使用这些工具进行FPGA设计,也逐渐成为了FPGA开发的主流方法。和ASIC设计不同的是,FPGA厂商并没有依赖传统EDA公司提供的这些设计工具,而是走了自主研发的道路。这是由于FPGA公司敏锐地认识到,只有将EDA技术掌握在自己手中,才能牢牢把握FPGA发展的未来。而这个看法,现在已被证明是绝对的真理。FPGA厂商针对自家FPGA产品开发的设计自动化工具,如英特尔(原Altera)的Quartus系列、赛灵思的ISE和Vivado系列等,一直被认为是这些公司“皇冠上的明珠”。早年间,由于各个厂商FPGA主体架构都比较相似,如何优化自家的设计工具,以取得更加出色的性能,就成为了FPGA厂商努力竞争的主战场。这些EDA工具中包含的各种专利与技术机密,也为这些公司构建了深厚的技术护城河。

■1.2.3 累积阶段:复杂片上系统的形成

进入21世纪,FPGA的发展进入了累积阶段。人们发现,FPGA的发展此时遭遇了瓶颈,因为单纯提升FPGA的容量已经不能满足各类应用的需求。同时,很多客户开始追求更高的性价比,并不愿意为过大的FPGA买单。在这个大环境下,FPGA开始从单纯的可编程门阵列,逐步转变为拥有复杂功能的可编程片上系统。除了进一步改进可编程逻辑单元本身的微架构之外,FPGA厂商还在FPGA的易用性上做足了功夫。例如,它们推动定义了诸多标准化的数据传输协议,方便不同设计和模块之间的互连与通信。它们还为很多重要而常见的功能开发了可以重复使用的IP核,例如软核微处理器(英特尔/Altera的NIOS,赛灵思的MicroBlaze)、存储控制器和各种通信协议栈等,可以供客户直接调用而无须再从头制造轮子。

与此同时,很多专用的逻辑单元也被添加到FPGA器件中,并逐渐成为现代FPGA的“标配”。例如,用于数学计算的加法进位链、乘法器、定点与浮点DSP单元,固定容量的片上存储器,以及各种速率的串行收发器和物理接口等。随着人工智能的兴起,AI引擎、可变精度的DSP等针对AI应用开发的IP核也被固化到FPGA中。可以看到,现代FPGA已经成为了各类全新科技的集大成者,而这也会反过来促使FPGA在更多应用场景里被使用。

那么,随着半导体技术的进一步发展,FPGA下一步会如何进化,以不断突破芯片维度和集成度的限制,并进一步为摩尔定律续命?当摩尔定律行将终结的时候,FPGA的架构又会发生怎样的改变,以适应下一个半导体行业发展的全新周期?在本章接下来的部分,我们将继续深入探究这些问题。