发布时间:2024-11-16 10:57:09 来源: sp20241116
随着各类大模型和深度神经网络涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代AI芯片已成为国际前沿热点。12日,《科学》杂志以《大规模光芯片“太极”赋能160 TOPS/W通用人工智能》为题,发表了清华大学电子工程系方璐副教授课题组、自动化系戴琼海院士课题组的研究成果。他们摒弃传统电子深度计算范式,在国际上首创分布式广度智能光计算架构,研制全球首款大规模干涉衍射异构集成芯片太极(Taichi),实现160 TOPS/W的通用智能计算。
作为人工智能的三驾马车之一,算力是训练AI模型、推理任务的关键。光计算是将计算载体从电变为光,利用光在芯片中的传播进行计算,以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。而光芯片具备高速高并行计算优势,被寄予希望用来支撑大模型等先进人工智能应用。科研团队介绍,“太极”光芯片有望为大模型训练推理、通用人工智能、自主智能无人系统提供算力支撑。
帮助光计算“挣脱”算力瓶颈,“从0到1”重新设计适合光计算的新架构,是科研团队迈出的关键一步。
相异于电子神经网络依赖网络深度以实现复杂的计算与功能,“太极”光芯片架构源自光计算独特的“全连接”与“高并行”属性,化深度计算为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。
论文第一作者、清华大学电子工程系博士生徐智昊介绍,在“太极”架构中,自顶向下的编码拆分—解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布式“大感受野”浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。
据介绍,“太极”光芯片的计算能效超现有智能芯片2至3个数量级,将可为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。(记者邓晖)
(责编:王仁宏、陈键)