学者观点

高文院士:构建智慧时代的“多媒体智能”新图景

2026-03-03 19:16:22
来源:
阅读:

页面导语

高文院士是我国多媒体智能、数字音视频编解码技术领域的领军者,也是AVS 数字音视频编解码标准体系的牵头人,其研究方向与我院及省级重点实验室、工程研究中心的“智能视频编码”“多媒体智能处理”“数字视网膜技术”等核心研究方向高度契合。

本页面整理了高文院士关于多媒体智能处理与智能视频编码的公开发表核心学术观点,作为实验室科研攻关与学科建设的权威学术指引。所有内容均来自院士官方主旨报告,严格忠于原文表述,可通过溯源链接核对。

 学者简介

高文,中国工程院院士,北京大学信息与工程科学部主任、博雅讲席教授,鹏城实验室主任,国际电气和电子工程师协会会士(IEEE Fellow)、美国计算机协会会士(ACM Fellow)。

长期从事多媒体智能处理、计算机视觉、视频编码与人工智能领域的核心研究,牵头制定我国具有自主知识产权的AVS 数字音视频编解码标准体系,提出“数字视网膜”新一代视觉计算架构,推动我国多媒体智能与视频编码领域实现从跟跑到领跑的跨越式发展。

 学术观点

1. 智能时代视频编码的双重优化方向

“传统视频编码仅关注人眼观看的画质与压缩效率,而智能时代的视频编码,必须同时兼顾机器智能分析的需求,实现面向人眼观看和面向机器理解的双重优化,这也是下一代多媒体编码标准的核心方向。”

官方出处:2024 中国多媒体大会特邀报告

官方溯源链接:https://www.pcl.ac.cn/html/1036/2024-07-26/content-4469.html

2. 数字视网膜:大规模视频智能处理的核心架构

“我们提出的数字视网膜技术体系,正是通过视频编码与特征编码的联合优化,打通编码传输与智能分析的全链路协同,从根本上解决城市级大规模视频多媒体数据智能处理的带宽与算力瓶颈。”

官方出处:2021 中国多媒体大会主旨报告

官方溯源链接:https://www.ccf.org.cn/Chapters/TC/TC_Listing/TCMT/News/2021-11-24/750511.shtml

3. 多媒体与人工智能的双向融合本质

“多媒体智能不是多媒体技术与人工智能的简单拼接,而是二者双向赋能的闭环:AI 重构多媒体处理的全链路范式,多媒体数据则为 AI 突破可解释性瓶颈提供了核心载体。”

官方出处:北京大学博雅人工智能讲堂首场报告

官方溯源链接:https://provost.pku.edu.cn/xwdt/fc737091ff954709b502d85daef12aee.htm

 对实验室的指导意义

 高文院士的核心观点,为实验室三大核心工作提供了精准的落地指引:一是在智能视频编码技术攻关中,锚定“人机双端协同优化”的核心方向,可依托院士牵头的 AVS 标准体系开展自主编码算法研究,直接破解江西本地智慧交通、城市综合治理中,大规模视频数据传输带宽高、后端算力消耗大的实际痛点;二是可基于数字视网膜技术架构,申报省级、国家级科研专项,搭建江西首个端边云协同的视频智能处理实验平台,填补省内该领域的技术空白,打造实验室的核心技术名片;三是在学科建设中,可将院士提出的“多媒体与 AI 双向融合”核心逻辑,融入我院本科生、研究生的智能多媒体、视频编码相关专业课程体系,培养贴合江西数字经济产业需求的多媒体智能领域本土人才。

合规备注

本页面所有观点均归原作者高文院士所有,内容仅整理自其公开发布的官方学术内容,仅用于学院学科建设与学术交流,无任何商业用途。如有内容偏差、版权问题,请联系我们第一时间更正。