講座報(bào)告主題:文檔智能模型的進(jìn)展與趨勢(shì)
專(zhuān)家姓名:白翔
日期:2025-11-08 時(shí)間:11:20
地點(diǎn):江蘇鎮(zhèn)江明都大飯店商務(wù)樓華怡廳
主辦單位:計(jì)算機(jī)科學(xué)與通信工程學(xué)院
主講簡(jiǎn)介:白翔,華中科技大學(xué)教授、博導(dǎo),國(guó)際期刊Pattern Recognition副主編(A-EIC)。在Nature Machine Intell.、IEEE TPAMI、CVPR等國(guó)際一流期刊和國(guó)際會(huì)議發(fā)表論文150余篇。擔(dān)任國(guó)際頂級(jí)期刊IEEE TPAMI編委,頂級(jí)會(huì)議CVPR、ICCV、ECCV、AAAI、IJCAI、NeurIPS的領(lǐng)域主席,國(guó)際文檔分析與識(shí)別會(huì)議ICDAR 2025大會(huì)主席。曾獲ACL 2024最佳論文獎(jiǎng)(Best Paper Award)、2024年湖北省青年科技創(chuàng)新獎(jiǎng)、2023年湖北省自然科學(xué)一等獎(jiǎng)(排1)、2021年全國(guó)科技系統(tǒng)抗擊新冠疫情先進(jìn)個(gè)人、2021年中國(guó)圖象圖形學(xué)學(xué)會(huì)自然科學(xué)一等獎(jiǎng)(排1)、2019年國(guó)際模式識(shí)別協(xié)會(huì)青年學(xué)者獎(jiǎng)(IAPR/ICDAR Young Investigator Award)。他是視覺(jué)與學(xué)習(xí)青年研討會(huì)(VALSE)的指導(dǎo)委員會(huì)成員,VALSE在線(xiàn)學(xué)術(shù)報(bào)告會(huì)(VALSE Webinar)活動(dòng)的共同發(fā)起人。研究專(zhuān)長(zhǎng):主要從事計(jì)算機(jī)視覺(jué)與模式識(shí)別、多模態(tài)大模型等方面研究。
主講內(nèi)容簡(jiǎn)介:在大模型時(shí)代,文字識(shí)別技術(shù)已經(jīng)取得了顯著的進(jìn)步,展示了實(shí)現(xiàn)通用OCR的潛力。在本次報(bào)告中,首先我將全面分析大模型在OCR識(shí)別方面的表現(xiàn);接著,我將介紹團(tuán)隊(duì)在多任務(wù)統(tǒng)一的文字識(shí)別方法,面向文檔智能理解的多模態(tài)大模型,大模型智能文檔推理等技術(shù)進(jìn)展;最后,我將對(duì)文檔智能的發(fā)展趨勢(shì)進(jìn)行展望。
歡迎師生參加!