过左移重新思考传统的工作流程可以帮助解决由工艺和热变化引起的持续性问题。

即使对于习惯于处理功率和性能权衡的设计人员来说,3D-IC 也是一个挑战,但由于人工智能的计算需求和数字逻辑的不断缩小,它们被认为是尖端设计不可避免的迁移路径。

人们普遍认为3D-IC是继续突破平面 SoC 极限的途径,也是将更多在不同工艺节点开发的异构设备添加到同一封装中的方法。但无论是平面 SoC 还是芯片组件,物理定律都是无法逾越的,工程师能使用的技巧非常有限,否则就会碰壁。

先进节点中较细的导线会增加电阻,从而增加热量。而较大的结构(如 3D-IC)则会扩大热梯度范围。而此类结构中散热的方式有限,使情况更加恶化。负面影响包括电迁移等细微影响以及芯片起火等突发状况。此外,随着制造工艺节点下降到个位数纳米范围,进而下降到埃范围,控制或考虑变化变得更加困难,这可能会导噪音增加和可靠性下降等严重问题。所有这些都要求设计人员在最佳性能规格和不配合的物理现实之间找到越来越脆弱的平衡。

3D-IC 的复杂性增加了曾经理论上存在的热问题的风险,例如自发 DRAM 刷新和可能导致设备关闭的热失控。在光子学应用中,热量可以通过改变光的波长来干扰通信。

图 1:芯片和封装组件的温度分布。来源:Ansys。

Ansys首席产品经理 Lang Lin 表示:“热也会导致时序问题。高温会导致线路延迟过高,从而降低电路速度。我们从代工厂那里听说,热是世界的中心。”

热量和工艺变化可能是独立的问题,也可能是彼此问题的乘数。无论如何,它们可能会级联,需要有远见才能解决。西门子EDA公司 Calibre 设计解决方案物理验证产品管理高级总监 Michael White 表示:“这些问题可能有点正交。解决热量问题必须在更宏观的层面上进行。如果我遇到热量问题,最简单的第一步就是更改平面图。如果这还不够,我可以开始考虑诸如在我的主动设计中放置热柱以将热量从热区吸走之类的事情。之后,我需要开始考虑芯片在封装中的位置。在最坏的情况下,如果我开始没有选择,我必须更改封装。我必须在上面放置散热器,等等。这些都是在创建整体组件的整个生命周期中从最简单和成本最低的选项开始。如果我可以左移,我就能尽早弄清楚这些问题。”

翘曲是首要问题

目前,3D-IC 面临的最大挑战是热致翘曲。翘曲已从偶然问题变为持续问题,因为高度堆积的异质材料配置会导致温度升高,并且需要复杂的热系数建模以避免产量损失。此外,基板更薄,这降低了基板将热量传导出设备的能力。

“大约一年前,没人谈论热致翘曲和应力分析,” Cadence产品管理总监 Melika Roshandell 说道。“由于 3D-IC,这方面的问题开始出现。设计对热的影响越来越大,尺寸也越来越小、越来越薄,这对翘曲产生了很大的影响。会议上的热门话题是热,但现在是热致翘曲。”

Lin 表示,中介层尺寸的增大也加剧了这一问题。“如今的 3D IC 中介层已经变得更大,可能从 2,000 到 5,000 平方毫米不等。因此,翘曲变得如此之大,以至于无法再忽略。之前翘曲大约为 5nm 左右,但对于大型中介层来说,翘曲甚至可能更高。两种材料之间的距离变化可能导致机械故障,导致芯片之间的连接破裂。”

机械应力是先进设计的另一个不可避免的结果,它增加了3D-IC 多物理场的担忧。西门子 EDA 公司 Calibre nmDRC 应用产品管理总监 John Ferguson 说:“机械应力问题与热问题密切相关。随着温度升高,导线会变形,从而改变机械应力。具体来说,主要担心的似乎在于凸块。我们是否获得了良好的粘附性和凸块清晰度,从而能够正确且充分地形成欧姆接触?晶圆开裂是另一个值得关注的问题,一般来说翘曲也是如此。如果将东西堆叠在一起,那么你必须保证两面都是平面的,否则就有出现气隙或其他形式间隙的风险。任何一个都不能忽视。”

添加TSV也成为一个问题。“你要挖出大洞,然后用其他材料填充它们,”Ferguson 解释道。“如何在不引起某种形式的翘曲的情况下做到这一点并不容易。这一切都取决于你在开始时如何控制芯片工艺,以确保它们尽可能平坦。下一步是小心堆叠东西的方式。例如,如果我们谈论的是将一个芯片堆叠在另一个芯片上,或者将第二个芯片堆叠在晶圆上,第一步是确保你有良好的平面度方法。这取决于你如何填充,以及制造、化学机械抛光工艺,以及它们的调整程度。当我们谈论非常薄的芯片时,这可能会变得更具挑战性。如果你谈论的是将单个芯片与其他芯片放在一起,那么有些情况下,一个芯片会故意悬在另一个芯片之上。这就像是一块跳水板,一边是陆地,另一边是悬在水池里。这绝对是可能发生扭曲的地方。”

情况已经变得如此糟糕,以至于影响到了基本优先事项。Cadence 的 Roshandell 表示:“SoC 设计师只关心三件事——功率、性能和面积——但热问题正在成为第四个问题。过去所有的 PPA 都在向 PPA-T 转变。”“你的性能越来越高。这意味着功率越来越高,而你想要减小面积,所以你的热问题会变得更糟。在所有这些方面,热问题总是对你不利。对于封装和 PCB,你还必须关心信号完整性、电源完整性、翘曲和其他热问题是全局问题的事情。你不能在一个小角落里看着你的芯片,在另一个小角落里看着你的封装和 PCB,然后说,“我的封装没问题,所以我不用担心其他事情。”你在进行热分析时必须考虑整个设计。这就是为什么任何工程师都必须着眼于整个问题,然后进行热分析。为此,尤其是在 3D-IC 中,您需要工具具有很大的容量,以便能够在不进行简化的情况下读取整个设计。如果您对其进行简化,您将失去访问权限,而许多工程师不知道从哪里进行简化。作为一名工程师,您需要记住这是一个全球性问题,您需要一个能够在设计的最早阶段进行分析的工具。”

如果热分析不够早,可能会出现问题。许多设备使用PVT 传感器来检测过热,然后根据需要采用热节流。西门子的怀特说:“芯片上分散的热传感器可以监测局部温度。如果顶部局部温度过高,它们就有能力减慢局部时钟。”

然而,这种解决方案是以牺牲性能为代价的,这使得设备缺乏竞争力。“[热节流] 并不能解决问题,”Ansys 半导体部门产品营销总监 Marc Swinnen 说。“它检测到问题,然后付出代价来修复它。名义上无法达到额定性能,因为芯片会不断升温并自我节流,所以成本非常高,而且它表明我们未能预测到这个问题。它出现了,现在我们付出代价来降低功耗,但这不是你想要的。你想要的是能够预测它。”

左移
EDA 专家继续强调,预测并减少问题的答案是左移。尽早了解和修复潜在问题要好得多。

“以前,设计师设计 IC,一切完成后,再将其发送给分析工程师。但现在这种方式已经行不通了,尤其是在 3D-IC 领域,”Roshandell 说道。“你必须从第一天就开始进行设计和分析,这样如果你需要更改设计中的任何内容,就可以立即解决。我们之前的一些权宜之计,例如增加风扇和散热器,现在都行不通了,因为热传递速度太快,等到到达散热器或液体冷却时,你已经处于热失控状态。你必须制定风险缓解计划。最好的情况是从第一天开始就知道风险是什么,这样你就可以找到解决方案。”

不应低估改变传统工作流程的挑战。鉴于人性,改变往往很难。设计师和公司可能没有意识到改变长期存在的工作流程的成本和时间优势。可能需要进行一些艰难的经济分析才能说服怀疑论者,尽管向左转变最初会带来破坏性影响,但从长远来看将更具成本效益。

“左移就是为了让设计师更有效率,”怀特说。“我们说服人们采用这种做法的方法是向他们展示,虽然今天做某件事需要几个小时,但只需几分钟就可以完成。而且在几分钟内完成之后,它会比使用传统方法干净得多。‘看看你能提高多少速度,以及你需要调试的错误减少了多少?这听起来不是更好吗?’”

左移可以帮助创建更稳健、更可靠的设计,但使用正确的工具,它还可以通过减少迭代次数来帮助整个设计过程加快速度。“如果你尽早开始进行热可行性分析,它会让你知道你的布局问题会在哪里,”怀特说。“所以你甚至可以在正确布局之前更改你的布局。如果你在最终封装之前不考虑热问题,并且你已经完成了每个 IC 的物理布局,那就太晚了。”

可靠性
热量和变化引起的问题不再只是短期问题。可靠性现在是多个市场的主要问题,芯片用于关键应用,并且预计使用寿命更长。提高可靠性的最佳选择是提前规划,并尽可能建立冗余和弹性。

“很多可靠性只是基本的统计数据,” Synopsys  EDA 集团杰出架构师 Rob Aitken 在接受采访时表示。“假设某个特定事件有发生的可能性。当我们进入较低的节点时,设备会更多,这意味着发生某事的概率会更高。如果你有一个有 500 亿个晶体管的芯片,那么就有 50 个地方可能发生十亿分之一的事件。”

依赖 TSV 来帮助进行热管理也可能会增加可靠性问题。“硅片中最大的可靠性故障点之一是通孔,”Swinnen 说。“这些传统上都是故障点。”

简而言之,曾经可以被忽视的问题现在已成为突出的问题,而提高认识是预防的最佳手段之一。

结论

尝试解决热问题最终可能会推动行业向左转变并重新思考活动孤岛。

Ansys 首席产品经理 Suhail Saif 表示:“当我们拜访客户时,我们最终会与许多各自为政的不同团队进行交谈。我们建议他们,为了更高效、更早、以最低成本成功签发芯片,他们需要合作。从他们的角度来看,这很难做到,但这些先进的效果让他们比以前更加努力。我们确实需要一个跨领域的统一解决方案,让他们相互交流,并意识到他们在一方所做的事情会对另一方产生连锁反应,反之亦然。热问题并不是大家聚在一起合作的唯一原因,但可能是最严重的原因。从成本和发布延迟方面来看,它可能对芯片设计整体影响最大。从这个角度来看,热问题是公司想要赢得市场份额时不能忽视的最重要、最关键的问题。”

最终,这些问题的答案最有可能来自人类的合作,以及材料科学或物理学。Cadence 的 Roshandell 指出:“从芯片设计师一直到最终产品,孤岛正在发生重大变化。”“人们使用相同的数据库进行分析,而芯片设计师提供数据库。我们看到行业发生了很大变化,人们在同一个数据库中一起工作。”

参考链接

https://semiengineering.com/design-flow-challenged-by-3d-ic-process-thermal-variation/