毕业论文
您现在的位置: 玩具 >> 玩具发展 >> 正文 >> 正文

独立DSP芯片兴衰史FPGA吹响了丧钟

来源:玩具 时间:2023/6/23
白癜风早期治疗几率 http://disease.39.net/bjzkbdfyy/170817/5633267.html

来源:内容由半导体行业观察(ID:icbank)编译自「eejournal」,谢谢。

DSP可以追溯到数字时代的开端,甚至可能更早一些。如果说年第一台数字计算机ENIAC的建造标志着年数字时代的开始,那么DSP则在两年后出现。

IEEE于年出版了一本名为《FiftyYearsofSignalProcessing:TheIEEESignalProcessingSocietyanditsTechnologies-》的专著,将DSP开始的时代年称为DSPannusmirabilis。同年,贝尔电话实验室的ClaudeShannon发表了题为“AMathematicalTheoryofCommunication”的具有里程碑意义的论文,该论文将可实现的比特率、信道带宽和信噪比之间的关系刻在石头上。

同一年,贝尔实验室的Shannon、BernardM.Oliver和JohnR.Pierce发表了“ThePhilosophyofPCM”,记录了脉冲编码调制的实用性,并在PCM上打上了实用性的烙印,这个理论的首次设想是由AlecReeves于年撰写。(伯纳德·奥利弗(BernardOliver)在更广的圈子中可能更为人所知的是巴尼·奥利弗(BarneyOliver),他是年创立惠普实验室的杰出人物,但那完全是另一回事。)Shannon、BernardM.Oliver和JohnR.Pierce正在记录一些PCM用于构建绝密SIGSALY安全语音系统的概念,这是一个房间大小、重50吨的庞然大物,为二战期间盟军最重要的语音通信进行编码和加密。

巧合的是,贝尔实验室于年6月30日宣布开发晶体管,同年发表了两篇引发DSP革命的里程碑式论文。(晶体管的实际发展发生在前一年。)我们需要晶体管和固态电子设备将Shannon,Oliver和Pierce发表的论文中的概念转化为价格低廉的实用技术,以改变电子产品的世界,所以年确实是DSP的奇迹年。

年之后,很长一段时间内DSP技术都没有发生太多变化。数字电子技术对于DSP来说太新了,无法实用,至少不能用于实时信号处理。在此期间,许多DSP涉及将数字手动输入Friedan和Marchant机械计算器,这对于音频或视频通信来说非常不切实际。DSP的萌芽世界等待着关键的发展。实际上,有几个关键的发展。

这是DSP和单芯片DSP如何接管整个信号处理世界的故事。它与数字电子本身的历史相似,跨越了集成电路(IC)、微处理器、DSP和FPGA的发展。在我们看来,FPGA最终大获全胜。

一些不稳定的步骤

使DSP实用化所需的第一个关键发展是IC的发明。几乎同时,德州仪器(TI)的JackKilby和仙童半导体的RobertNoyce设想了两种截然不同的方法来构建第一个集成电路。年2月,TI的Kilby首先申请了专利。Kilby曾设想在一根硅棒上构建多个电子元件,然后使用小的金键合线将它们连接在一起。在申请专利之前,他实际上确实在年建造了这样的电路。然而,Kilby错综复杂的手工组装过程是完全不切实际的,而且不太可能扩大到商业批量生产。

Noyce于年初提出的想法是使用光刻技术,仙童半导体已经使用这种技术制造硅晶体管,在一个芯片上对多个电子元件进行成像,然后使用相同的光刻技术将这些元件与金属互连层互连。他将细节留给JeanHoerni,后者开发了自那时以来一直用于制造IC的平面工艺。Noyce和Fairchild比Kilby晚,但仍是在年就这些想法申请了专利。

用于制造IC的实用制造方法只是所需的许多关键发展中的第一个。早期的数字IC太原始,并且包含的晶体管太少,无法认真考虑将它们用于实际的DSP。那是因为DSP涉及一个非常深奥的概念——称为数学。特别是,您需要两个关键的数学运算符——乘法和加法——并且您需要使用大量这些运算来执行DSP。我们中的一些人成为了数字工程师,所以我们可以忘记数学。

DSP工程并非如此。使用DSP时,无法逃避数学运算。

当电子世界正在等待足够的半导体技术进步使DSP成为一种实用技术时,世界其他地方已经迫不及待了。BellSystem需要开发方法来通过其庞大的线路安装基础来填充更多语音容量,而PCM显然是第一步。此外,二战后军队对雷达和声纳的使用蓬勃发展,DSP显然是改进和提高这些系统能力的途径。通信卫星最初是在年由ArthurC.Clarke撰写的一篇论文中设想的,它将需要数字通信来解决一些可怕的信噪比问题,这些问题涉及向地球轨道发送信号和从地球轨道接收信号。

世界已准备就绪,但IC尚未准备就绪。

当DSP世界等待半导体技术迎头赶上时,信号处理理论家却没有。贝尔实验室的BinshuAtal和ManfredSchroeder于年开发了自适应预测编码(AdaptivePredictiveCoding:APC),这使得从4.8kbps比特流中获得适度的音频成为可能。

然后,Atal开发了用于语音压缩的线性预测编码(LinearPredictiveCoding:LPC)。几乎同时,名古屋大学的FumitadaImakura和NTT的ShuzoSaito开发了偏相关(partialcorrelation:PARCOR)编码,这是一种非常相似的算法。这些新的语音处理算法自然需要更多的计算——更多的乘法和加法——这使得需要专门的IC来使DSP实用且具有成本效益变得越来越明显。

但是,通过带宽受限的电话信道运行的语音并不是唯一需要DSP信号的地方。雷达和声纳信号处理算法也需要它。真正占用带宽的电视信号需要它。只要技术实用,生成和接收的每个信号都可以从DSP中受益。如果它不需要装满TI和许多其他供应商在年代销售的中型IC的机架和电路板机架就好了。

英特尔于年推出的第一个商用微处理器是对即将到来的事物的第一个暗示。Intel微处理器当然可以进行乘法和加法运算,但是一次只能加四位,而且乘法是一个多步指令序列。硅是愿意的,但ALU和位宽很弱。

第一个DSP芯片并没有完全削减它

TRW于年设法创建并销售了16×16位单芯片数字乘法器——MPYH——这是一款采用1微米双极工艺技术制造的产品。TRWMPYH可以将两个16位数字相乘以在45纳秒内产生32位结果(dash-1部分为40纳秒),但无法相加。您需要添加额外的IC以将累加器连接到乘法器。此外,您无法在一次操作中提取32位结果。您通过IC的16位输出端口将结果分成两部分。所以这个产品真的不是DSP。它只是DSP的一部分。此外,由于具有两个16位输入端口和一个16位输出端口,TRWMPYH必须封装在64引脚宽DIP中。它以5V电压运行,但它几乎需要一个放大器才能启动。在5瓦时,它也需要一点冷却。

AMI于年推出了S信号处理外设,它是一个带有12位硬件乘法器、一个16位ALU和一个16位输出的DSP,但它并不是作为单芯片DSP设计的。AMI将S设计为用于8位微处理器的存储器映射外围设备,AMI还制造该产品作为微处理器的创始人摩托罗拉半导体的替代来源。AMI的微处理器版本被称为S。

微处理器通过一个小型和三个较大的片上多端口RAM配置和访问AMIS。尽管AMIS于年发布,但它基于一种难以制造的VMOS工艺技术,因此推迟了几年的到来。到那时,已经发布了几款单芯片DSP;随着Intel、ZilogZ和Motorola0的推出,16位微处理器时代已经到来;微处理器外设市场开始迅速萎缩。那就使得过时的AMIS从未取得商业成功。

在AMI推出S信号处理外设的同一年,TI向消费者推出了一款基于DSP的玩具,即电池供电的“SpeakSpell”,该玩具采用LPC作为其核心语音编码技术。SpeakSpell玩具采用了TITMC语音合成器芯片,该芯片在硬件中实现了BinshuAtal的LPC算法。TOTMC本质上是一个专用的DSP。

尽管当时的半导体技术将TISpeakSpell的词汇量限制在个单词,但这款玩具的稀疏词汇量对于儿童玩具来说是一个巨大的技术飞跃,即使零售价高达(当时)50美元。尽管TITMC是一种专门的专用语音DSP,但其低成本和电池运行时间的能力为即将到来的DSPIC指明了道路。

年2月,英特尔试图通过宣布英特尔“模拟信号处理器”来表达“是的,我们可以做到”。这个奇怪的集成DSP在前端有一个9位ADC(8位加符号)和一个四输入模拟多路复用器,一个9位DAC有一个8通道模拟采样保持电路和模拟多路复用器在前端后端,中间的数字ALU能够执行加法、减法和绝对值运算以产生25位结果。缺少乘法和除法指令迫使使用多指令序列来执行这些所需的DSP数学运算。每个乘法运算需要12条指令,除法运算需要14条指令。每条Intel指令需要大约半微秒来执行,

Intel是为信号过滤应用而设计的,但它的执行速度慢、数据路径有限、指令集独特、缺少硬件乘法器、模拟输入和输出电压范围有限以及其他严重的限制,这些都注定了该IC的商业失败。

因此,尽管很少有人记得英特尔,但它也预示着DSP的到来。

随着年代结束,世界显然已经准备好,甚至渴望真正的单芯片DSP。多亏了理论家,算法才得以开发并准备就绪。许多信号处理应用都在乞求功能强大的DSP芯片。剩下的就是开发能够支持这些要求的芯片设计和工艺技术。AMI、ATT、英特尔、松下、摩托罗拉、NEC、TI、ADI公司和其他公司都在为这个问题而疯狂地工作。DSP芯片的爆炸式增长迫在眉睫。

在年DSP的奇迹年之后,又过了三个十年,实际的、实用的DSP芯片才会出现。像TRW的MPYH硬件乘法器和TI的TMCLPC语音芯片这样的DSP零碎部件被戏弄了——真正的集成DSP指日可待——但直到年代,半导体技术才发展到足以使可编程DSP芯片实用化。年代和年代,单芯片DSP的数量呈爆炸式增长。

然后,20年后,单芯片DSP的时代戛然而止。

WallyRhines在年代为德州仪器(TI)工作,他非常想离开TI在德克萨斯州Lubbock的工厂。当他有机会管理TI在休斯顿的微处理器业务时,他选择了这个职位,因为他发现休斯顿是一个更具吸引力的居住地。此外,没有人想要这份工作。TI的16位微处理器由于其缺乏竞争力的16位地址空间而陷入困境。由于未能在通用微处理器市场上分得一杯羹,莱茵斯在休斯顿TI新采用的微处理器团队创建了一个四管齐下的专用处理器战略。TI分叉战略的四个方面是:

TMSDSP系列TMS系列图形处理器TMS大容量存储处理器(很快无处可去)用于IBM网络架构的token-ringLAN处理器TMS其中,TMSDSP系列成为战略中的摇滚明星。正如Rhines在接受采访时所说,“……它给我们上了一课:绝望是创新之母。”经过几年的酝酿,TI于年4月推出了第一批TMSDSP。然而,对于这样的新技术来说,仅仅构建芯片是不够的。多年来,TI一直在宣传DSP,并通过软件开发工具和培训为其新DSP提供支持,然后才看到这些部件取得重大成功。根据Rhines的说法,TI又过了五六年才开始从这些产品中看到一些真正的收入。

TI不是第一个

然而,TI的DSP芯片肯定不是市场上的第一个。英特尔早在年就推出了命运多舛的模拟信号处理器,但该公司的另一款产品16位微处理器在其拥有8位外部数据总线的“弟弟”——微处理器——成为IBMPC的核心。Intel从视线中消失了,很可能是因为Intel的全部注意力都被吸引到了通用微处理器市场。

TI只是年代初期准备进入DSP领域的几家半导体公司之一。根据ForwardConcepts总裁和数十年来一直聚焦在DSP的分析师WillStrauss的说法,第一批发布的带有硬件乘法器/累加器的“真正”单芯片DSP是ATTDSP-1——由贝尔实验室开发,并在年5月的ATT内部会议上亮相。年2月在IEEE固态电路会议上,NEC又带来了NECPD。ATT将DSP-1纳入其开创性的电话网络5ESS电子交换系统。随后,ATT继续开发了几代设备,其中包括DSP16和DSP32(第一个浮点DSP芯片)。然而,ATTDSP-1及其后继者仍然被贝尔系统所拥有,

NECPD有一个16×16位乘法器和两个16位累加器,因此它是一个真正的单芯片DSP。尽管NEC在年初宣布了该设备,但它直到年才与所需的开发工具一起上市。Strauss指出,NECPD在日本取得了最大的成功,就像日本的许多可编程IC一样,这颗芯片在欧洲也很流行。

从年推出的DSP处理器开始,摩托罗拉半导体成为年代争夺DSP芯片主导地位的另一个早期竞争者。摩托罗拉DSP有一个24位硬件乘法器和两个可以再扩展8位的48位累加器使用一对扩展寄存器。这种大数据字能力使摩托罗拉DSP能够处理高精度音频,因此摩托罗拉DSP迅速受到高端音频系统开发商的欢迎。

在年代决斗

DSP领域的主要参与者在年代和年代争夺主导地位。他们生产了多代越来越强大的设备,这些设备具有多个硬件乘法器、浮点硬件乘法器和更大容量的片上存储器。到年代后期,TI、摩托罗拉和飞利浦已经开发出具有VLIW架构、多个乘法器/累加器以及用于特殊操作(例如位混频)的附加功能单元的DSP怪兽处理器。

当竞争性芯片技术突然出现并让DSP供应商蒙蔽时,更大、更强大的独立DSP芯片的开发突然停止。正如希克苏鲁伯小行星在万年前消灭了恐龙,并在岩层中留下一层薄薄的铱作为名片一样,FPGA在千禧年之交让单芯片DSP党崩溃了。

DSP的一个基本原理和一些历史相结合,解释了FPGA如何以及为什么迅速消灭单芯片DSP作为一个充满活力的处理器类别。

首先,原理:DSP全是数学,DSP性能依赖于非常快速地执行大量乘法/累加运算(MAC)的能力。这就是为什么最新的单芯片DSP具有多个硬件乘法器/累加器单元和附加功能单元以从乘法器/累加器路由非MAC操作的原因。设备拥有的MAC单元越多,执行DSP操作的速度就越快,因为大多数DSP算法都包含多个MAC单元可以利用的许多固有并行性。

现在,回顾历史:FPGA于年首次亮相,当时Xilinx推出XC。第一个FPGA只不过是一堆非常慢的门(实际上是基于查找表的可编程逻辑块),周围有很多可编程互连。这种早期的架构设计使FPGA能够在电路板设计上吞噬许多TTL芯片的逻辑。但是最早的FPGA速度很慢。他们没有威胁到当时的处理器,当然也没有影响到DSP领域。反正一开始不是。

FPGA扩张时代

由于从一开始FPGA就打算骑着摩尔定律,因此FPGA发展到年,就从原来的XilinxXC微不足道的64逻辑块增长到数以万计的逻辑块。在一篇题为“ThreeAgesofFPGAs:ARetrospectiveontheFirstThirtyYearsofFPGATechnology”的文章中,前Xilinx研究员SteveTrimberger将年代的FPGA增长时期称为“扩展时代”。在这个时代,FPGA沿着摩尔定律曲线发展,并通过集成越来越多的可编程逻辑块而变得越来越大。然而,与ASIC相比,在FPGA内用可编程逻辑构建的电路相对较慢,在硅片使用方面效率低下,而且价格更高。因此,使用可编程逻辑构建的MAC相对较慢且成本较高。

后来,在Trimberger的“积累时代”——当FPGA添加硬化MAC块时——FPGA突然成为DSP的重要竞争对手。FPGA并不仅仅增加了一两个硬件乘法器;在摩尔定律的慷慨支持下,他们增加了几十个。

第一个集成快速硬件乘法器的FPGA器件系列是XilinxVirtex-IIFPGA系列。年7月,Xilinx宣布它已经出货了价值万美元的Virtex-IIXC2VFPGA,每个FPGA都有个硬化的片上18×18位乘法器。因此,第一个包含硬件乘法器的FPGA的性能已经超过了当时存在的每一个单芯片DSP,而且很可能超过了所有将要存在的单芯片DSP。

Altera紧随Xilinx并于年发布了其第一代具有36×36位硬件乘法器的StratixFPGA。StratixFPGA中的硬件乘法器可拆分为18×18位或9×9位乘法器,以允许更多的MAC运算,尽管位分辨率较低。在本世纪的头几年,Xilinx和AlteraFPGA系列在可以执行的同步MAC操作数量上远远超过单芯片DSP。

今天的FPGA有很多MACS

今天,英特尔(年收购了Altera)和赛灵思的一些最小的FPGA提供了大量的硬件乘法器。较旧但仍然可用的IntelCycloneIVFPGA系列的成员包含80到个18×18位嵌入式乘法器。同样,较旧的XilinxSpartan6FPGA系列包括具有8到个DSP48A1slice的器件,而较新的XilinxArtixFPGA系列的成员包含多达个DSP48E1slice。每个DSP48A1Slice包含一个18×18位乘法器和一个48位累加器,而每个DSP48E1Slice包含一个25×18位乘法器和一个48位累加器。DSP48切片乘法器中的位数似乎随着时间的推移而增加。

Intel和Xilinx的最大FPGA具有数千个DSP模块,并且能够比最快的DSP芯片每秒提供三个数量级的MAC。例如,最大的IntelStratix10TXFPGA系列的成员提供个精度可调DSP模块,每个模块包含两个18×19位硬件乘法器,可以配置为一个27×27位乘法器。在一个大芯片上多达11,个硬件乘法器。最大的XilinxVirtexUltraScalePlusFPGA包含12,个DSP48E2slice,每个slice包含一个27×18位乘法器和一个48位累加器。

请注意,英特尔和赛灵思并不是唯一将硬件乘法器塞入其FPGA的FPGA供应商。您可以从Achronix、Lattice和Microchip获得FPGA,这些FPGA具有内置在设备中的各种DSP硬件(MAC)。例如,最近发布的LatticeCertusPRO-NXFPGA有两种尺寸可供选择,具有96或个片上18×18位乘法器。

如果您仍想编写DSP代码并在单片DSP上运行它,你可以使用恩智浦提供DSP、DSP和MSCDSP系列。这些是摩托罗拉DSP系列最新的——也可能是最后的——单芯片后代。此外,您仍然可以购买现成的TITMSFPGA系列成员。同时,硬件乘法器在通用处理器的设计中变得非常普遍,在那里您可以找到完全能够提供可观的DSP性能的巨型位SIMD矢量单元,甚至在微控制器中,这样您就可以更轻松地将DSP集成到即使是最小的嵌入式设计。

对于这一切,要感谢摩尔定律。

然而,在这一点上根本没有可比性。如果您的高性能DSP应用需要大量快速MAC运算,那么具有成百上千个快速硬件乘法器的FPGA是独一无二的合格产品。

转载请注明:http://www.0431gb208.com/sjszyzl/5220.html