半导体测试技术变革:迈入AI时代
原文转发自“Semiconductor Engineering”。
数据密集型应用持续爆发式增长,推动全球半导体行业深刻变革。这种对数据的海量需求催生了一个全面的生态系统:传感器和系统用于采集数据、网络用于传输数据,以及强大的存储和处理能力用于分析数据。
这些应用的成功部署依赖于日益复杂的半导体技术发展。确保芯片质量需要优化效率的测试策略,而集成自动测试设备(ATE)和系统级测试(SLT)的方案,能够满足数据中心和边缘设备中AI和高性能计算(HPC)应用的动态需求。
AI应用是数据洪流的核心驱动力
AI应用已成为关键增长引擎,推动半导体行业持续蓬勃发展,朝着2030年实现1万亿美元收入的目标迈进(见图1)。随着AI应用日趋复杂,对计算资源的需求持续增长,底层技术也必须同步革新。在日益复杂的芯片中,微处理器所含的晶体管数量正以指数级增长,便是直观体现。
图1:图表引自“半导体十年:万亿美元产业”,2022年4月,麦肯锡公司,www.mckinsey.com
高性能计算需求约每3.4个月翻一番,增速超越摩尔定律,推动异构集成(将多个核心集成到单个先进封装中)成为趋势。这些技术进步使测试领域的整体复杂性显著上升。
除了CPU和GPU等数字运算处理器外,超高速数据中心互连(DCI)成为高效传输海量数据的关键。DCI通过低延迟高速光链路实现跨数据中心(甚至跨海和洲际)连接,带来全新的测试挑战。例如,DCI可能依赖通信芯片内的相干光学器件实现每波长高达800 Gb/s的数据传输速率。此类芯片的测试为ATE创造了独特机遇。
边缘AI推动需求倍增
AI算法在处理语言、图像、声音、温度、面部识别等非结构化数据方面表现出色,能有效解决用户实际场景中的问题。然而,受延迟、带宽和隐私限制,在集中式云或企业数据中心部署AI应用往往不可行或效率低下。
边缘AI成为解决方案——将AI应用部署在网络边缘(靠近用户的设备中),而不是集中式云端或数据中心。这使得AI处理可在数据生成地附近(本地)完成,尤其适用于需要实时响应、带宽受限或存在隐私和合规问题而不适合集中处理的场景。
边缘设备可以是智能手机、笔记本电脑、自动驾驶汽车或物联网设备(如恒温器或安保摄像头)。例如,工业领域利用边缘AI实现工厂车间中各种设备的预测性维护、质量控制和实时决策。医疗保健设备、智慧城市、无人机等需要计算的场景也广泛应用边缘AI。边缘AI和数据中心AI常常协同工作,为特定应用提供优化方案。
所有这些应用对测试策略提出了全新要求。
测试策略与芯片性能同步革新
为应对AI、HPC和高速数据互连对芯片性能的更高需求,先进的ATE系统如今融入了更强的智能和灵活性,支持更广泛的测试协议,并能快速适应不同的测试场景。增强的ATE能力包括并行或多工位测试、高频信号生成和分析以及实时数据处理。这些功能有助于缩短测试时间并提高产能,在芯片性能需求持续攀升的背景下至关重要。
例如,多工位测试可以在单次测试同时测试多个芯片。这种方法能够显著提高产能并降低总测试成本,在半导体芯片日益复杂且生产规模不断扩大的情况下尤为重要。并发测试支持对同一芯片或多个芯片并行执行不同测试。这种策略最大限度地提高了测试设备的利用率,加快了测试流程,并有助于满足越来越短的上市时间要求。最终,通过多工位测试和并行策略可以降低每台测试机的总测试成本。
高频测试确保芯片满足AI、HPC和高速数据互连对数据速率和信号完整性的要求。测试抖动、相位噪声和谐波失真等参数是确保高速应用中性能可靠的关键。
自适应测试会在测试过程中,根据实时数据和反馈动态调整测试条件。这种方法可以聚焦关键区域并减少冗余,从而优化测试时间和资源。自适应方法尤其适用于应对工艺波动和确保产品质量一致性,这在大批量制造环境中尤其重要,因为制造过程中的变异性会影响产品良率和性能表现。
ATE与SLT协同
ATE还能与SLT配合使用。SLT通过模拟芯片实际使用环境,能够检测到常规测试难以发现的问题,例如电源管理故障、信号完整性问题和热性能问题(见图2)。这种测试方法超越了传统的晶圆和封装测试,确保芯片在集成到智能手机、数据中心或汽车系统等最终应用时能够正常工作。
图2:ATE与SLT测试时间
实现全面的测试覆盖,在确保质量的同时平衡测试成本
当产品进入大批量制造阶段时,可通过调整测试环节来缩短测试时间,同时保持测试覆盖率不变。这种做法通常被称为“左移”和“右移”策略。左移测试意味着将测试提前到设计与制造流程的早期阶段(如晶圆检测和部分封装),以便尽可能地识别出合格裸片(KGD)。而右移测试则将测试覆盖延伸到制造过程后期(例如最终测试阶段),从而提升缺陷检测能力。这样既能保证产品质量,又能通过更高的并发测试降低成本。通过结合运用这两种策略,可在整个制造流程中实现质量与良率的最佳平衡,最终优化整体质量成本(见图3)。
图3:调整测试覆盖以优化质量成本
确保无线测试能力
需要注意的是,随着AI节点增长,无线网络也需同步升级——数据处理量的增加要求网络速度更快、效率更高。因此,随着5G及未来6G等新一代通信标准的推出,无线设备和组件的空中传输(OTA)测试逐渐兴起。OTA与毫米波技术紧密相关,后者能够帮助缓解体育场和机场等人流密集城市环境的网络拥堵。OTA的应用引入了封装天线(AiP)芯片,其更高的工作频率和带宽需求带来了新的测试挑战。
OTA测试通过模拟实际使用场景评估芯片性能(无需直接物理连接),这对确保天线和收发器等无线组件在实际运行中的可靠性和性能至关重要。OTA测试有助于检测传统有线测试中难以发现的信号传播、干扰和环境因素相关问题。
将AI引入测试流程
AI在优化测试流程方面也发挥着关键作用。通过分析测试过程中收集的数据,机器学习和AI可识别故障规律,例如高频故障元器件、故障发生条件及时机。这些洞察可用于绘制帕累托图,确定主要故障点,进而推动趋势分析、优化测试流程并调整测试计划。常见故障因素可在流程早期测试,稳定后若能在覆盖率、质量和成本之间取得合理平衡,可将其移至测试后期(比如SLT阶段)。
例如,AI算法可检测到传统测试方法可能遗漏的异常,或通过聚焦最关键的参数来缩短测试时间。这种数据驱动的方法有助于提高测试覆盖率、降低成本并加速半导体新品上市。
半导体测试是AI应用成功的基础
半导体架构的革新与超高速5G网络的发展,推动数据密集型AI和边缘计算应用不断涌现,测试复杂度也随之显著提升。测试领域的领军企业必须制定先进且灵活的策略,以满足AI、HPC和高速数据互连对芯片性能的更高要求。现代ATE系统必须更智能、更具适应性,能够处理复杂高速芯片并支持各类测试协议。
随着全球数据需求的爆炸式增长,正是ATE创新助力半导体制造商跟上芯片性能快速提升的步伐,有效应对现代半导体芯片日益复杂化的挑战。借助智能灵活的测试方法,半导体行业可以确保下一代半导体技术的质量、可靠性和性能。