娱乐场 1188-合星娱乐场注册送现金-一筒娱乐场官网备用

新聞中心

講準(zhǔn)字【2025】第280號(hào):會(huì)議智能底座:高可用多模態(tài)說(shuō)話(huà)人日志的系統(tǒng)化實(shí)踐

發(fā)布時(shí)間:2025-11-05 瀏覽量:

講座報(bào)告主題:會(huì)議智能底座:高可用多模態(tài)說(shuō)話(huà)人日志的系統(tǒng)化實(shí)踐
專(zhuān)家姓名:劉濤
日期:2025-11-08 時(shí)間:16:30
地點(diǎn):江蘇鎮(zhèn)江明都大飯店研發(fā)樓308
主辦單位:計(jì)算機(jī)科學(xué)與通信工程學(xué)院


主講簡(jiǎn)介:劉濤,思必馳技術(shù)專(zhuān)家,上海交通大學(xué)計(jì)算機(jī)系博士。以多模態(tài)智能交互為主要研究方向,聚焦多模態(tài)說(shuō)話(huà)人日志技術(shù)的持續(xù)優(yōu)化,重點(diǎn)探索跨模態(tài)信息融合及精準(zhǔn)說(shuō)話(huà)人識(shí)別等核心問(wèn)題,推動(dòng)語(yǔ)音與視覺(jué)模態(tài)的深度協(xié)同與融合。目前已在A(yíng)AAI、ACM MM、ICASSP等國(guó)際會(huì)議及期刊發(fā)表相關(guān)成果,并擔(dān)任多個(gè)國(guó)際會(huì)議及期刊的審稿人。研究專(zhuān)長(zhǎng):多模態(tài)智能交互。


主講內(nèi)容簡(jiǎn)介:本報(bào)告以現(xiàn)代會(huì)議場(chǎng)景中的智能需求為切入點(diǎn),介紹以多模態(tài)說(shuō)話(huà)人日志(Speaker Diarization)為核心能力的“會(huì)議智能底座”系統(tǒng)框架,致力于實(shí)現(xiàn)高效穩(wěn)定、可度量、可運(yùn)維的會(huì)議智能服務(wù)。報(bào)告以端—邊—云協(xié)同的視角,闡述音頻處理、說(shuō)話(huà)人定位與畫(huà)面追蹤、會(huì)議內(nèi)容理解與語(yǔ)義提取等多模態(tài)技術(shù)的融合應(yīng)用,強(qiáng)調(diào)系統(tǒng)在復(fù)雜真實(shí)環(huán)境(如噪聲干擾、多人同時(shí)發(fā)言、快速切換等)下的魯棒性提升策略。通過(guò)明確延時(shí)、準(zhǔn)確性和多媒體同步等關(guān)鍵指標(biāo),結(jié)合實(shí)際工程中的容錯(cuò)、熱更新、降級(jí)策略以及在線(xiàn)優(yōu)化的方法論,推動(dòng)會(huì)議智能技術(shù)從實(shí)驗(yàn)室到真實(shí)場(chǎng)景的落地應(yīng)用。最終,本系統(tǒng)旨在將會(huì)議內(nèi)容轉(zhuǎn)化為組織內(nèi)可管理、可檢索的知識(shí)資產(chǎn),實(shí)現(xiàn)會(huì)議場(chǎng)景下智能化與知識(shí)化的持續(xù)運(yùn)營(yíng)。


歡迎師生參加!

專(zhuān)家姓名 劉濤 講座時(shí)間 2025-11-08 16:30
講座地點(diǎn) 江蘇鎮(zhèn)江明都大飯店研發(fā)樓308