解决芯片复杂性增加的可扩展方法
不断增加的设计复杂性和多物理挑战阻碍了系统芯片(SoC)设计团队的生产力。Mellanox工程师应用新的解决方案,利用大数据技术和灵活的计算资源来提供电子设计自动化功能。
不断增加的设计复杂性和多物理挑战阻碍了系统芯片(SoC)设计团队的生产力。工程师需要的电子设计自动化工具不仅可以减少运行时间,还可以提高他们批判性检查和改进设计的灵活性。Mellanox工程师应用新的解决方案,利用大数据技术和灵活的计算资源来提供此功能。
高速网络是数据中心连接的主干。极端带宽和超低延迟网络解决方案对于下一代数据中心高效处理新兴AI、5G和自主应用程序中呈指数级增长的数据至关重要。由于芯片尺寸和复杂性与不断增加的时间市场压力相冲突,为网络进行系统芯片(SoC)设计的公司面临挑战。网格复杂性和门的数量每年都在急剧增加,网络IC团队必须设计、分析和带出尺寸为400–500 mm或更大的芯片。
各种多物理效应(包括功率和热可靠性)的交叉耦合增加,对FinFET的设计关闭提出了重大挑战。多物理分析对于克服这些挑战至关重要,以便设计超大、复杂和高能耗的芯片,尽管设计裕度越来越小,项目进度也越来越紧。
面对这种复杂性,设计团队必须拥有能够提供容量、灵活性、速度和准确性的软件工具。
Mellanox是端到端以太网和InfiniBand智能互连解决方案和服务的领先供应商,为服务器、存储和超收敛基础设施提供服务,它直接了解这些挑战和权衡。设计团队必须通过最有效地利用计算资源和工程时间来管理和验证设计。为此,该团队依赖于Ansys RedHawk-SC软件。
寻找可视性
Mellanox团队需要快速的周转时间和精确的压降精度,以确保其高度复杂的网络处理器的电源完整性和可靠性。但他们也在寻求一些早年在其他大型、高复杂性设计中无法实现的东西:分析的灵活性和速度。由于设计已经从45nm节点的略多于1亿个网络发展到16nm的近3.5亿个网络,Mellanox估计它将需要解决7nm的近4.5亿个IC网络。
这种类型的进化需要工具能力来匹配。十年前,在45nm工艺节点及其周围,工具体系结构通常是单片的,团队仅限于一台可以同时处理多达10亿个电源和接地节点的机器。(节点是提取的电源和接地网络中任意两个元件之间的连接点。这些元件可以是导线或连接到导线的设备实例引脚的寄生电阻、电感或电容。节点数是功率完整性分析中常用的一种指标,用于预测设计尺寸;它直接影响分析的运行时和内存需求。)
在那些日子里,工具容量是一个问题。当对电源完整性和可靠性进行多次分析时,每次运行(串行而非并行)可能需要超过24小时。这需要大型服务器和大量资源分配才能完成分析。更糟糕的是,系统偶尔会在管理复杂性方面遇到困难,并会崩溃。然后必须从头开始分析。
第二代人出现了,以跟上复杂性。这一代利用了分布式计算,可以扩展到32台机器,最多可以处理40亿个节点。在集成电路变得更加复杂之前,这是令人满意的。
按大数据要求扩展
为了提供见解并使团队能够优化其设计,Mellanox需要一个灵活、高容量的解决方案,该解决方案可以扩展到大数据挖掘和分析。工程师于2018年开始使用Ansys RedHawk-SC。RedHawk SC是基于Ansys SeaScape构建的最新SoC电源完整性和可靠性签署平台,Ansys SeaScape是世界上第一个用于电子系统设计和仿真的定制大数据架构。SeaScape提供了单核可扩展性、灵活的设计数据访问、瞬时设计启动以及许多其他功能
成功的关键之一在于RedHawk-SC的弹性计算能力。弹性计算有助于根据可用CPU内核的数量并行(或串行)处理场景。
SeaScape体系结构是弹性计算的核心。它依赖于分布式数据/文件服务,因为数据可能分散在许多位置。除此之外,还有一个基于MapReduce概念的分布式数据分析层,这是所有大数据分析的基础。这在概念上将数据(映射)分割为称为碎片的小块,并将每个碎片聚集起来进行分析。当服务器可用时,可以根据需要将处理分发到任意多个服务器。
电源问题
这些类型的网络处理器面临的挑战是总功耗和功耗。与电池供电设计不同,Mellanox使用的设计类型可以消耗200 W以上。因此,工程师必须完成完整的设计分析——准确的增量功率完整性和可靠性分析——同时考虑高功耗,而不牺牲准确性或结果时间。
为了加速全芯片红外跌落仿真,可以利用电网上卷方法来抽象电力和地面网络的中低层金属。这种抽象可以用于全芯片仿真。这允许团队在单元级工作,然后跳到顶层对全芯片设计进行全面分析
进行全芯片扁平化运行需要耗费大量资源和时间。通过使用大数据分析技术执行增量分析,设计者可以创建特定块的详细视图,并抽象出其他所有内容。这使他们能够执行更快的分析,并更容易地进行更快速的工程变更单(ECO)修复。
Ansys RedHawk-SC凭借其弹性计算能力和支持大数据的分析功能,为工程师提供了克服之前一些挑战所需的可见性。该团队特别赞赏红鹰SC的自我维持稳定性,以监控自己的工作,并在失败时续签工作。
该团队还利用RedHawk-SC的弹性计算及其支持MapReduce的分析来获得关键见解。MapReduce为设计者提供了一个鸟瞰视图,并且可以非常顺利地将焦点对准。它提供了强大的功能,例如在不到两分钟的时间内启动GUI以查看完整的芯片数据库,以及轻松导航不同的区域,如谷歌地图的功能。
此外,它还支持更强大的计算灵活性。凭借RedHawk-SC的弹性可扩展性,曾经需要巨大计算资源的大型芯片区域可以分解成非常小的部分进行分析。架构的性质允许这些元素通过公司的计算资源进行分发。这样,它可以最大限度地利用硬件资源并优化成本。