
本文由半导体产业纵横(ID:ICVIEWS)编译自semiengineering
数据中心在AI近乎无法满足的需求驱动下持续扩张,推动行业增长。
2025年无疑是充满意外变化的一年。这些变化对半导体行业及其所有支撑领域产生了重大影响。并非所有的变化都是坏事,但灵活性已成为持续成功或充分利用机遇的必要条件。
航空航天和国防等行业在全球范围内正迎来显著增长。数据中心在AI近乎无法满足的需求驱动下持续扩张,尽管供应链面临挑战,这仍在推动行业增长。
Rambus的研究员兼杰出发明家Steven Woo表示:“有几件事的发展速度超出了我的预期,包括已宣布的AI基础设施投资、预期的半导体和存储器消耗量、电力需求以及对先进封装的需求。也有一些事情的进展比我希望的要慢,包括先进工艺节点的基础电压缩放、高数值孔径极紫外光刻(High-NA EUV)的使用以及Chiplet(芯粒)接口的标准化。”
变化的速度是一个共同的主题。ChipAgents首席执行官William Wang表示:“我以前认为半导体行业的发展步伐要慢得多,但过去六个月证明我错了。AI驱动的存储器和存储超级周期的开始、IDM战略的快速转变、对代理式AI(Agentic AI)的激增需求以及EDA,都加速了整个技术栈的创新。”
AI正在直接或间接地影响整个行业。IC Manage执行副总裁Shiv Sikand表示:“大公司正在雇佣更多的工程师。每个人都想制造芯片。以前大家只关注软件,忘记了硬件。然后你意识到,等一下,软件需要在某种东西上运行。于是‘芯片’再次成为核心。我们将拥有更多的芯片,我们将拥有更好的芯片,因为AI工具让我们更加高效。”
不仅仅是芯片。proteanTecs首席战略官Uzi Baruch表示:“单一业务公司正在向技术栈的上下游移动,制造了新的竞争压力,也创造了新机会。芯片公司开始构建完整的系统,甚至是数据中心规模的解决方案,而超大规模企业和设备制造商则在定制芯片上投入巨资。围绕这些垂直化方法形成了整个生态系统,随之而来的是新的商业模式。公司发现自己不仅涉足芯片层面,还涉足系统层面,许多公司进入定制芯片业务以实现差异化并捕获更多价值链。”
供应链全球供应链已经断裂,企业正竞相应对后果。Fraunhofer IIS自适应系统工程部门高效电子部门负责人Andy Heinig表示:“真正让我们惊讶的是我们的供应链如此不稳定。我们最近在欧洲的Nexperia问题上再次看到了这一点。我们曾期望供应链在疫情后会变得更稳定一点,但它们再次出现了问题。我们不能再指望从世界各地获得设备。我们需要更多的本地供应链,也许还需要更多的本地解决方案。成本仅为几分钱的器件引发了问题,并摧毁了整个供应链。”
即使是最简单的器件消失也会产生重大影响。Fraunhofer IIS/EAS设计方法学部门负责人Roland Jancke表示:“OEM厂商正试图建立不易受干扰影响的供应链。Nexperia的问题意味着大众汽车无法再生产汽车。我们不再有第二货源的概念,即如果一家公司无法交付,另一家公司可以迅速介入。”
半导体制造已开始变得更加分散,改变了组装和封装的动态。Synopsys旗下Ansys的产品营销总监Marc Swinnen表示:“‘先进封装’这个名称具有误导性。它有些操之过急。正在做的是芯片组装,这是一件新鲜事。它有自己的格式,自己的限制。”
这也创造了一些新机会。Fraunhofer的Heinig表示:“很明显,传统的封装无法在欧洲完成,因为以欧洲的薪资水平做这件事是不可能的。但如果我们做先进封装和Chiplet——在封装中放入更多功能,封装本身也更复杂——那么在欧洲做这件事是有意义的,因为这样你就有了附加值,并在供应链中建立了更多的信任。”
停滞的Chiplet在半导体行业中,从事先进芯片组装和封装的企业与继续采用单片集成的企业之间的分歧日益加大。Arteris产品管理和营销副总裁Andy Nightingale表示:“2.5D和3D设计方法的成熟速度超出了预期。CoWoS、Foveros Direct和I-Cube3的产能扩张使多芯片变得切实可行。EDA流程终于赶上了封装物理学,集成了热、应力和电压感知收敛。这种转变也到达了互连层。片上网络不断演进,以管理跨多个裸片的延迟平衡、带宽分配和IP解耦——有效地验证了互连设计作为一门系统级学科的地位。有趣的是,Chiplet验证开始如此迅速地模仿传统的NoC集成方法。”
但这并不意味着这很容易。Keysight Technologies设计与验证业务部总经理Nilesh Kamdar表示:“Chiplet将继续存在,但我认为良率挑战尚未解决。Chiplet仍然是一套非常复杂的技术,将多个芯片封装在一起仍然昂贵且困难。它行之有效,并在某些3D存储器堆叠中得到了很好的展示。但除此之外,该领域仍有许多工作要做。”
数据中心的设计正在采用2.5D集成,因为它们别无选择。它们已经达到了光罩极限,为了增加算力,它们必须分散到多个裸片上。大多数设计尚未达到这一阶段,因此经济效益看起来并不那么吸引人。IC Manage的Sikand说:“我从来都不是Chiplet的忠实粉丝,因为我相信超大规模集成电路(VLSI)。Chiplet是集成的截然对立面。如果它不是发生在同一个裸片上,那就意味着Chiplet之间有连线,而连线总是会减慢一切,导致复杂性、串扰、干扰和侧信道攻击。集成硅仍然是‘圣杯’。”
但当达到光罩极限时,Chiplet可能是最简单的前进道路。proteanTecs的Baruch表示:“随着传统缩放墙变得不可否认,异构集成已从可选项优化转变为满足现代AI和HPC工作负载的基本策略。让许多人惊讶的是生态系统对齐成熟得如此之快。封装技术、EDA流程和测试方法共同进步,使得直到最近还感觉是投机性的架构得以实现。然而,随着集成密度的增加,新的系统级变异性和故障机制也随之而来,挑战了长期以来关于可靠性和覆盖率的假设。”
看来这一趋势将持续下去。Synopsys产品管理执行总监Shekhar Kapoor表示:“去年,我们预测50%的HPC设计将是多芯片的。12个月后,行业报告和调查证实了我们的预期——多芯片设计正在达到规模化。多芯片设计已成为先进半导体设计的基石。这种转变由两股力量推动:单片缩放的物理和经济限制,以及AI和HPC工作负载对更高性能和效率的爆炸性需求。”
除了尺寸之外,采用Chiplet还有其他原因。Ansys的Swinnen说:“比如产品系列的灵活性。你可以在多种工艺之间切换,而无需重新设计整个产品。你只需为了可升级性进行交换。例如,如果你有一个新的USB接口,你不必重新设计整个芯片。你只需换掉那个Chiplet就可以了。除了单纯的性能和功耗之外,还有其他优势。”
行业正在努力实现这一目标。Heinig说:“在Chiplet峰会上,人们对Chiplet感到沮丧。数据中心方面并非如此。对他们来说,这一点非常清楚,因为他们需要Chiplet来获得性能。但对于行业的其他部分,许多公司已经停止了所有Chiplet活动,因为没有商业模式。如果你采用Chiplet,一切都会变得更昂贵。”
但也有曙光。Heinig补充道:“在过去几周,特别是国防和汽车领域,我们要收到了加快Chiplet进度的请求。对于某些公司来说,很明显他们必须多花一点钱,而Chiplet可以成为确保其供应链安全的解决方案。他们将先进封装和Chiplet视为实现这一目标的途径。通过使用积木模块,你可以从两家供应商订购处理器并获得灵活性。”
仍有许多问题需要解决。Keysight的Kamdar问道:“当我们谈论运行在数十或数百千兆赫兹的芯片时,Chiplet或2.5D或3D堆叠是什么样子的?如果在航空航天应用中,通信芯片旁边有一个数字芯片会发生什么?那里正在解决的问题截然不同,而且由于更高频率的通信挑战,这些问题更难解决。我们看到在这个领域有很多参与,并且已经发表了一些令人兴奋的研究。我只是认为它的推出速度会稍慢一些。”
行业可能需要耐心。Swinnen说:“Chiplet更多的是一种愿景而非现实。它被过度炒作了,但最终我们会实现它。这就像IP革命一样。人们曾为此挣扎。在问题解决之前,花了几年的时间进行标准化。Chiplet比那更复杂,因为涉及的内容更多。但最终我们会到达那里。”
标准将是更广泛采用的基石。Synopsys的Kapoor表示:“标准正在取得进展,先进封装技术正在为异构集成提供动力。这些发展反映了行业向多芯片设计的根本性转变。UCIe 3.0规范于8月发布。此更新提供了高带宽、互操作性和生态系统升级,降低了风险并加速了采用,支持多芯片设计成为主流设计策略。”
为了建立一个更加开放的Chiplet市场,需要克服一些技术障碍。Keysight的Kamdar说:“热和机械应力分析正从利基市场转变为必要条件。如果你看Chiplet问题,它不仅仅是‘我能把芯片封装得更近吗?’我必须看看功耗会发生什么,温度会发生什么,如果我堆叠太多芯片会发生什么。是否存在改变芯片老化的机械应力?不仅从电子角度,而且从多物理场角度探索事物,正开始变得更加必要。”
AI的采用AI的迅速崛起正在影响着每个人。proteanTecs的Baruch表示:“生成式AI的爆炸式增长重塑半导体路线图的速度甚至超过了最大胆的预测。最初的算力竞赛迅速变成了系统级转型,暴露了内存带宽、互连、电源完整性、可靠性和生命周期监控方面的瓶颈。AI部署的规模和速度将设备复杂性推向了前所未有的水平,随之而来的是对可观测性、可预测性和长期弹性的更深层次要求。”
这些瓶颈正在持续得到解决。Rambus的Woo表示:“正如预期的那样,内存仍然是性能的关键驱动因素,但计划中的建设规模将需要对半导体制造和先进封装进行巨额投资才能跟上。我曾预计HBM(高带宽内存)将继续受到关注,并且对当前和未来HBM DRAM的需求仍然看不到尽头。Rubin CPX的宣布以及GDDR与Rubin和HBM的协同使用是一个惊喜,表明行业对大型语言模型(LLM)的长期生存能力和效用充满信心,并需要针对不同阶段和用例优化硬件。”
但并非所有人都能以同样的速度前进。Kamdar说:“令我惊讶的是,人们对AI有着巨大的渴望,但在EDA方面,反应更加微妙。你看到的那些基础模型,以及你从OpenAI、Google和其他公司看到的,他们发布新基础模型的速度有多快,以及它被采用的速度有多快——EDA领域肯定有稍微不同的视角。”
这有几个原因。Real Intent首席执行官Prakash Narain表示:“在2025年,我们开始播种进入AI的努力,因为在此之前,AI似乎很有前途,但一切变化太快,对其进行可持续的工程投资有点令人困惑。今年这种情况变得清晰了。另一个变得更清晰的方面是从培训的角度来看AI的价值。通常,每当我们的客户引入工具的新用户时,都涉及培训元素。AI很好地促进了这一方面,减少了达到专业水平或熟悉所需的时间。”
EDA流程的许多方面正在得到改进。Synopsys的AI产品管理总监Anand Thiruvengadam表示:“在生成式AI助手或Copilot的开发和部署方面取得了重大进展。这些Copilot现在提供有关工具和工作流程的专家指导,自动化复杂的任务(如RTL和形式验证测试平台的创建),并极大地提高了设计团队的效率和生产力。AI代理能够单独或作为协调团队的一部分进行推理、规划、学习和执行工程任务。通过协作,多代理系统可以解决以前需要大量人工努力和专业知识的复杂、多步骤工程挑战。”
关于模型也存在疑问。它们真正适合什么任务?IC Manage的Sikand表示:“代理式AI是当前流行的风味,但LLM本身存在缺陷,因为它们无法推理,而且它们的编程方式是为了取悦用户。我们需要的是世界模型。LLM是在白人男性数据集上训练的。我们的期刊、我们的新闻、我们的政治两极分化、我们的社会问题都是第一世界的问题。但是地球上的大多数人在哪里?他们不在这里。我们如何帮助这些人?这更重要。AI真正需要做的是帮助人们摆脱贫困,这样我们才能拥有一个更美好的世界。”
AI的采用也巩固了关于云使用的观点。Kamdar说:“我们看到发生了重大变化,许多公司现在要求所有AI都应在本地(on-prem)交付。这涉及设计、EDA和IP,大多数公司还没准备好让他们的IP离开现场进入云端。我们发现这一点是因为我们开发了云端应用程序,我们不得不转型并将其修改为本地AI解决方案。”
数据中心每个人都意识到数据中心建设的速度,但它究竟有多大?Ansys电子和半导体业务部总监Rich Goldman表示:“半导体行业正在谈论到2030年成为万亿美元产业,仅仅看增长率。这对半导体行业来说是一个伟大的标志。但最近,黄仁勋表示,Nvidia一家公司就能预见Blackwell和Rubin到2026年(五个季度)的销售额将总计达到5000亿美元。这是他们去年收入的三倍。这给了他们半导体行业声称在五年内将达到数字的一半。这不仅让我惊讶,也让我震惊。”
虽然增长是好事,但它要求基础设施的其他部分能够跟上。Woo说:“我预计AI基础设施建设的规划将继续全速前进,但令我惊讶的是Meta、Google、Oracle和OpenAI等公司正在讨论的投资规模。支持拟议投资规模所需的电力令人难以置信。电力已变得如此重要,以至于在谈论部署时使用的单位是吉瓦,而不是每秒万亿次操作(TOPs)或一些传统的计算相关指标。”
这向整个行业发出了明确的信号。Sikand说:“如果我们要构建下一代AI,我们没有足够的电力。我们还没有解决核聚变问题。我们仍然依赖传统能源。今天,建设这些数据中心所需的能量密度是不可行的。我们以前说过这个,但现在我们面临规模问题,而且电力不足。如果你看看正在产生多少电力,仅仅就新增发电量而言,这都发生在中国。那里有巨大的发电量,所以他们能够扩张。我们电力短缺。硅谷需要提高效率并推动效率。你不一定需要我们在传统架构中目前拥有的晶体管数量。”
设计公司需要适应。ChipAgents的Wang表示:“功耗、性能和热限制已成为一流的设计约束,而架构、工艺和封装的协同优化现在几乎是在实时进行的(集成了流片前和流片后流程)。行业对AI工作负载的反应表明,当计算需求和硅能力之间的反馈回路收紧时,硬件进化的速度可以像模型创新一样快。”
这将在适应者和无法足够快地做出改变者之间造成分歧。Baruch说:“功耗和性能管理已成为未来缩放的最重要限制因素。解决这个问题将是下一个增长时代的关键推动力,它将成为每家半导体公司的首要战略重点。”
验证Siemens-Wilson研究小组的数据显示,首次流片成功率又一年出现下降,大部分重新流片(respins)是由规格变更或不完整引起的。Arteris的Nightingale表示:“AI帮助更快地发现错误,但并没有阻止规格漂移。可执行规格仍然更多是愿景而非现实,大多数流程是文档驱动的,而不是数据驱动的。需求、RTL和测试之间的集成仍然是碎片化的。规格可追溯性仍然是最薄弱的环节。直到规格变得可执行并得到持续验证之前,重新流片将继续存在。”
AI正在推动新应用的开发。Breker Verification Systems首席执行官Dave Kelf表示:“验证AI是一个明显的应用,我们已经看到这一领域的加速发展。现在很容易预测可执行规格的出现,即机器读取手动规格,然后创建完整的测试平台。然而,我对2026年的预测是,这种新技术将与回归基础的验证基础相定制,将更传统的技术与AI前端相结合,从而创建适用于当今设计跨越验证过程的实用流程。”
还有可能针对新兴设计趋势定制验证策略和工具。Real Intent的Narain说:“在AI芯片中有很多复制和重复,至少在核心AI芯片中是这样。每个复制的模块都相对简单,但设计的总规模非常大。有机会利用这些方面。我们可以利用AI设计的哪些特殊属性?我们能否创建新应用程序或改进现有应用程序,使其对正在发生的AI设计规模更有效率?”
新兴技术一些技术似乎已经处于风口浪尖好几年了。Swinnen说:“量子计算被人们谈论,许多人说它被过度炒作了。然而,如果你看看量子计算公司的估值,它们还在继续上升。像IBM和其他公司并不傻。他们知道自己在做什么。他们继续投资量子技术。这让我怀疑也许发生的比我们要知道的更多。为什么这些估值持续上升,为什么这些公司坚持投资?有什么是我们不知道的?”
其他人也有同样的看法,但也看到了潜力和可能的颠覆。Sikand说:“围绕量子计算和量子位能做什么有很多炒作。这令人兴奋,因为事情可能会以如此戏剧性的方式发生变化。例如,据称量子计算机可以改变比特币计算。即使由于有限的限制没有剩下多少币可挖,它也可以在眨眼之间挖出它们。”
它还将各种技术结合在一起。Kamdar说:“光子学和量子技术的融合正在发生。我们可以看到量子计算继续沿着这条道路发展。它绝非主流,但量子计算的研究仍在继续,1000量子位计算机及更多计算机的公告正在发布。西方世界正在进行大量研究,但你也看到它在世界其他地方发生。日本、印度和其他国家正在宣布围绕量子计算的重大研究计划。”
光子学可能也准备好大展身手了。Swinnen说:“并非完全出乎意料,但共封装光学器件终于来了。它们已经存在多年,但总是太贵、太复杂。技术还不太成熟,所以应用有限。现在有一种感觉,它们终于到了。台积电通过表示‘这是一种标准架构,具有足够高的带宽和足够的可靠性,可用于广泛应用’,从而全力支持COUPE架构。”
这正受到数据中心的推动。Kamdar说:“硅光子学在短距离通信中的影响,从机架到机架,甚至可能在板载、片上,肯定正在发生。在AI行业和正在投资的数万亿美元中,钱不再是唯一的因素。只要我们能展示更快的速度,就有足够的投资,也有钱可赚。”
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。
铁牛配资提示:文章来自网络,不代表本站观点。