講座報(bào)告主題:大模型賦能視覺(jué)任務(wù):研究選題與未來(lái)展望
專(zhuān)家姓名:彭宇新
日期:2025-09-28 時(shí)間:10:00
地點(diǎn):計(jì)算機(jī)學(xué)院208報(bào)告廳
主辦單位:計(jì)算機(jī)科學(xué)與通信工程學(xué)院
主講簡(jiǎn)介:彭宇新,北京大學(xué)二級(jí)教授、博雅特聘教授,CAAI/CIE/CSIG Fellow,863項(xiàng)目首席專(zhuān)家,中國(guó)工程院“人工智能2.0”規(guī)劃專(zhuān)家委員會(huì)專(zhuān)家,中國(guó)人工智能產(chǎn)業(yè)創(chuàng)新聯(lián)盟專(zhuān)家委員會(huì)主任,中國(guó)圖象圖形學(xué)學(xué)會(huì)副秘書(shū)長(zhǎng)、提名與獎(jiǎng)勵(lì)委員會(huì)副主任,北京圖象圖形學(xué)學(xué)會(huì)副理事長(zhǎng)。以第一完成人獲2016年北京市科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)和2020年中國(guó)電子學(xué)會(huì)科技進(jìn)步獎(jiǎng)一等獎(jiǎng),2008年獲北京大學(xué)寶鋼獎(jiǎng)教金優(yōu)秀獎(jiǎng),2017年獲北京大學(xué)教學(xué)優(yōu)秀獎(jiǎng)。主持了863、國(guó)家自然科學(xué)基金重點(diǎn)(2項(xiàng))、北京自然科學(xué)基金聯(lián)合基金重點(diǎn)、發(fā)改委專(zhuān)項(xiàng)等40多個(gè)項(xiàng)目。發(fā)表TPAMI、IJCV、CVPR、NeurIPS、ICML等ACM/IEEE Trans.和CCF A類(lèi)論文160多篇,獲最佳論文獎(jiǎng)2次。參加10屆(10年)由美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)舉辦的國(guó)際評(píng)測(cè)TRECVID視頻搜索比賽,均獲第一名,參賽隊(duì)伍包括斯坦福大學(xué)、卡內(nèi)基梅隆大學(xué)、牛津大學(xué)等。成果應(yīng)用于國(guó)家網(wǎng)信辦、公安部、國(guó)家廣播電視總局等重要單位以及華為、騰訊、快手、蔚來(lái)、美團(tuán)、中國(guó)電信、中國(guó)鐵塔等頭部企業(yè)。擔(dān)任IEEE TCSVT高級(jí)領(lǐng)域編委、IEEE TMM等期刊編委,培養(yǎng)博士生獲中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)電子學(xué)會(huì)等優(yōu)博。研究專(zhuān)長(zhǎng):主要研究方向?yàn)槎嗝襟w分析、計(jì)算機(jī)視覺(jué)、人工智能。
主講內(nèi)容簡(jiǎn)介:隨著GPT、Gemini等大模型的廣泛應(yīng)用,以O(shè)penAI、Google為代表的工業(yè)界與學(xué)術(shù)界的研究焦點(diǎn)正日漸分化。面對(duì)工業(yè)界大模型的高速迭代,學(xué)術(shù)界研究者應(yīng)如何選題、找準(zhǔn)自己的賽道,是一個(gè)亟待思考的問(wèn)題。本報(bào)告圍繞大模型賦能視覺(jué)任務(wù),通過(guò)具體選題示例,探討如何利用大模型的特有優(yōu)勢(shì)突破視覺(jué)任務(wù)面臨的各項(xiàng)關(guān)鍵局限性。此外,報(bào)告從全維度細(xì)粒度、具身智能與群體智能、世界模型與空間智能等方面展望大模型的未來(lái)研究方向。最后,總結(jié)了大模型時(shí)代下選題的三個(gè)標(biāo)準(zhǔn):理論性、挑戰(zhàn)性與實(shí)用性。
歡迎師生參加!