首页  >  学术活动  >  学术交流  > 正文
哈工大(深圳)计算机学院王强副教授合作论文获ACM EuroSys 2025最佳论文奖
发布时间:2025-04-05 10:24 浏览:[]

ACM EuroSys 2025于3月30日至4月3日在荷兰鹿特丹召开。哈工大(深圳)计算机学院计算机应用研究中心王强副教授与香港科技大学(广州)褚晓文教授团队和香港科技大学王威副教授的合作论文《SpInfer: Leveraging Low-Level Sparsity for Efficient Large Language Model Inference on GPUs》荣获Best Paper Award(最佳论文奖)。


ACM EuroSys (The European Conference on Computer Systems) 是计算机系统领域的久负盛名的国际顶级学术会议,也是中国计算机学会推荐的A类国际学术会议(CCF A)。会议主要关注计算机系统领域的研究与实践,包括操作系统、数据库系统、实时系统、网络中间件、分布式、并行或嵌入式计算系统等领域。自2006年创办以来,ACM EuroSys已经出版了众多具有深远影响的学术论文,备受学术界和工业界的广泛关注。本届EuroSys 2025会议共有85篇论文入选,录用率为12.4%,2篇论文获最佳论文奖和2篇论文获最佳学生论文奖。另一篇最佳论文奖来自美国芝加哥大学、斯坦福大学以及微软公司合作的关于大模型方面的研究。


王强博士毕业于香港浸会大学,毕业后2022年5月入职哈尔滨工业大学(深圳)计算机学院王轩教授团队从事科研教学工作,与其博士导师褚晓文教授的高性能机器学习实验室保持长期紧密的合作,近期研究主要聚焦于大模型训练与推理性能与能效优化方法,取得了一系列显著的科研成果,相关成果被应用于华为、平安等公司的产品中,团队自主研发的超大规模分布式算力管理与优化平台被国内外大学和科研机构广泛应用。


大语言模型(LLMs)在诸多领域都展现出了卓越的能力,但其庞大的模型规模在存储和计算成本方面带来了显著挑战。尽管无结构剪枝方法通过引入稀疏性来降低资源需求,但在LLM推理中的性能亟待改进。这主要是由于索引非零元素的存储开销以及在低稀疏性水平(约50%)下稀疏矩阵乘法(SpMM)内核的计算效率低下。


论文提出的SpInfer是一个面向GPU的稀疏LLM高性能推理框架。SpInfer首先设计了一种新型的稀疏格式,通过位图表示最小化非零元素索引开销,并针对GPU张量核心架构进行了优化。此外,基于新的稀疏格式,论文提出了共享内存位图解码(SMBD)来实现高效的片上索引解码,并利用异步流水线优化SpMM内核,以提升计算效率。在不同的矩阵稀疏度(30%到70%)上,SpInfer显著优于现有的最先进SpMM,效率提升2倍以上,LLM端到端推理效率最高提升1.58倍。更重要的是,论文提出的算法在低稀疏度情况下仍然能够超越英伟达官方的稠密矩阵计算库cuBLAS。


针对目前通用大模型因参数庞大而导致的存储成本高和计算效率低的问题,SpInfer将显著降低大模型部署所需的硬件成本,并大幅提升推理速度,对大模型在各行各业广泛的落地应用将起到极大的推动作用。


论文链接:https://dl.acm.org/doi/10.1145/3689031.3717481


中心作者介绍:



王强,哈尔滨工业大学(深圳)计算机科学与技术学院副教授,博士生导师,“鹏城孔雀计划”特聘岗位。2014年于华南理工大学获得学士学位,2020年于香港浸会大学获得博士学位,期间获香港政府奖学金HKPFS资助。研究方向包括高性能计算、节能计算以及分布式机器学习,长期致力于面向异构计算平台(尤其是GPU)的性能以及能效优化的关键技术研究,取得了丰硕的研究成果,发表高水平学术论文超过40篇,以第一作者或通讯发表CCF-A/清华推荐A类论文15篇,包括TPDS,EuroSys,IPDPS,IWQoS,INFOCOM,ICML,ICLR,AAAI,CVPR,ECCV等国际顶级会议和期刊,3篇论文分别获得国际会议IEEE DataCom 2018、IEEE GreenCom 2020和ACM EuroSys 2025最佳论文奖,谷歌学术引用超过1900次。曾担任IEEE/ACM IWQoS 2024网络主席,长期担任多个顶级会议的程序委员,包括ICDCS、ICCV、ECCV、ICML、ACMMM以及AAAI,同时也长期受邀担任多个知名期刊的审稿人,包括TPDS,TNSE,TCC,ToN。主持国家自然科学基金青年基金、深圳市优秀科技创新人才培养项目、深圳市高层次人才引进科研基金以及多项国家高新企业、世界500强企业产学研项目。


图1 ACM EuroSys 2025颁奖现场


图2 最佳论文奖奖状


热文排行