2024年12月23日,广东省安全智能新技术重点实验室主办,深圳市计算机学会元宇宙专委会,深圳市计算机学会大模型专委会协办的SAILING讲坛第二十三期于哈尔滨工业大学(深圳)顺利召开。
广东省安全智能新技术重点实验室是由广东省科学技术厅于2022年批准成立的省级科研平台,依托哈尔滨工业大学(深圳)进行建设管理。实验室遵循“开放、流动、联合、竞争”的发展方针。以提高自主创新能力为目标,聚焦广东优势学科、支柱产业以及重大战略需求,科学规划、整体布局,推进实验室体系提质增效,着力加强基础研究和源头创新能力,着力推进科技研发和成果转化,着力培育创新型人才队伍,着力强化开放共享,使之成为支撑广东建设更高水平科技创新强省的战略科技力量。
本期论坛围绕《生成式人工智能的压缩与理解》展开。随着生成式人工智能技术的迅猛发展,其在信息传播与知识构建过程中的作用日益凸显。生成式人工智能所生成内容的准确性、可靠性以及合规性愈发引人瞩目。此技术在编码转换、数据压缩等复杂任务中的表现,能否精准地对各类数据进行高效编码,以实现高效的模型推理与理解是关键的科学问题。本次SAILING讲坛由哈尔滨工业大学(深圳)陈斌副教授主持,由特邀嘉宾香港城市大学王诗淇副教授和香港科技大学助理教授陈隆做精彩报告。
王诗淇老师做了题为《智能视频编码》的特邀报告。报告中,王老师介绍智能视频压缩的技术难题与挑战,并分享了王老师在智能视频编码及质量评价方面的相关研究成果与思考。报告还探讨了如何利用多模态大模型的生成能力实现更为高效的质量评价与编码。最后,王老师介绍了低复杂度生成式人脸视频编码相关标准化方面的工作,并对未来面向人体视频、自然视频和AI生成视频的压缩重建技术及应用进行讨论。报告结束后,现场师生就视频编码的现状及解码器性能限制与王诗淇老师展开了热烈讨论。
陈隆助理教授做了题为《Multimodal Understanding and Generationwith Efficiently Finetuned Foundation Models》的特邀报告。如今的预训练基础模型已在不同应用场景中展现出惊人的能力。在过去几年间,数以百计的基础模型被相继提出。尽管取得了重大进展,但微调基础模型存在一个突出的弱点,即训练成本高昂。在本次演讲中,陈老师分享一系列关于高效微调基础模型的工作,涵盖参数高效、内存高效、模态高效以及标注高效的训练方法。除此之外,陈老师还分享了一些利用这些经过高效微调的基础模型所开展的典型下游多模态理解与生成应用案例。报告结束后,现场师生就如何更好的微调基础模型的细节问题与陈隆教授展开了热烈讨论。
嘉宾简介:
王诗淇,香港城市大学副教授,博士生导师。从事视频编码与处理、人工智能、计算机视觉等方面的研究。在国内外期刊和会议上发表/接收论文300余篇,其中包括IEEE 汇刊论文100余篇。论文谷歌引用13000余次。目前担任人工智能、视频处理领域旗舰期刊IEEE-TIP, TMM, TCyber和TCSVT 编委,并获得IEEE ICME, VCIP, MultiMedia等多个国际会议和期刊的最佳论文奖。王诗淇博士的研究也获得香港研究资助局杰出青年学者计划等多项项目资助。
陈隆,香港科技大学助理教授。从事于计算机视觉、多媒体、机器学习以及自然语言处理领域。具体而言,他致力于构建一个能像人类一样理解复杂视觉场景的高效视觉系统。所谓“像人类一样”,是指视觉系统应当具备多种能力,比如可解释性、鲁棒性以及通用性。他在多个国际会议上担任领域主席(AC)或高级程序委员会委员(SPC),这些会议包括神经信息处理系统大会(NeurIPS)、计算机视觉与模式识别会议(CVPR)、美国人工智能协会年会(AAAI)、国际人工智能联合会议(IJCAI)以及英国机器视觉会议(BMVC)。
(审核:陈斌)