新华网北京4月12日电 近日,清华大学电子工程系方璐课题组、信息科学技术学院院长戴琼海院士课题组,摒弃了传统电子深度计算范式,构建了智能光计算的通用传播模型,首创了名为Taichi(意为“太极”)的干涉—衍射分布式广度光计算架构。基于此创新架构,课题组进一步探索干涉光与衍射光的优势特性,又研制出干涉—衍射异构集成智能光计算芯片,可实现每秒每焦耳160万亿次运算的通用智能计算。 光电智能技术交叉创新团队部分成员合影(左三为戴琼海院士、右二为方璐副教授) 相关科研成果于12日发表于国际学术期刊《科学》。 方璐、戴琼海为论文的通讯作者,电子工程系博士生徐智昊、博士后周天贶(清华大学水木学者)为论文第一作者。 以光波为载体进行智能计算,具备高速、低功耗等特性。然而,现有智能光计算局限于简单的字符分类、图像处理等。其痛点是光的高性能计算潜力受困于电子计算架构,计算规模受限,无法支撑亟须高算力与高能效的复杂大模型智能计算。 直面科研领域痛点问题,清华大学团队帮助光计算“挣脱”算力瓶颈,另辟蹊径,“从0到1”重新设计适合光计算的新架构。相异于电子神经网络依赖网络深度以实现复杂的计算与功能,“太极”光芯片架构源自光计算独特的‘全连接’与‘高并行’属性,化深度计算为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。 据论文第一作者、清华大学电子系博士生徐智昊介绍,在“太极”架构中,自顶向下的编码拆分-解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布式‘大感受野’浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。 方璐表示,“之所以将光芯片命名为‘太极’,也是希望可以在如今大模型通用人工智能蓬勃发展的时代,以光子之道,为高性能计算探索新灵感、新架构、新路径。” 据悉,太极光芯片的计算能效超现有智能芯片2—3个数量级,将可为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。目前该团队正与相关机构洽谈,建设算力实验室,以期用智能光计算芯片支撑大模型训练与推理、通用人工智能等人工智能研究与应用。
【责任编辑:岳祥芝】