娱乐场 1188-合星娱乐场注册送现金-一筒娱乐场官网备用

新聞中心

講準(zhǔn)字【2025】第224號(hào):VoxCPM:面向高擬真語(yǔ)音生成的高效大模型架構(gòu)探索與應(yīng)用

發(fā)布時(shí)間:2025-10-16 瀏覽量:

講座報(bào)告主題:VoxCPM:面向高擬真語(yǔ)音生成的高效大模型架構(gòu)探索與應(yīng)用
專(zhuān)家姓名:劉知遠(yuǎn)
日期:2025-10-19 時(shí)間:09:00
地點(diǎn):江蘇鎮(zhèn)江明都大飯店研發(fā)樓-401
主辦單位:計(jì)算機(jī)科學(xué)與通信工程學(xué)院


主講簡(jiǎn)介:劉知遠(yuǎn),清華大學(xué)計(jì)算機(jī)系長(zhǎng)聘副教授。已在Nature Machine Intelligence等人工智能著名國(guó)際期刊和會(huì)議發(fā)表論文200余篇,Google Scholar統(tǒng)計(jì)引用超過(guò)6.9萬(wàn)次。曾獲教育部自然科學(xué)一等獎(jiǎng)(第2完成人)、中國(guó)中文信息學(xué)會(huì)錢(qián)偉長(zhǎng)中文信息處理科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)(第2完成人)、中國(guó)中文信息學(xué)會(huì)漢王青年創(chuàng)新獎(jiǎng),連續(xù)五年入選2020-2024年Elsevier中國(guó)高被引學(xué)者。研究專(zhuān)長(zhǎng):主要研究方向?yàn)榇笳Z(yǔ)言模型、知識(shí)工程與社會(huì)計(jì)算。


主講內(nèi)容簡(jiǎn)介:本報(bào)告介紹清華大學(xué)聯(lián)合面壁智能推出的VoxCPM——一款基于擴(kuò)散自回歸建模的端到端語(yǔ)音生成模型。作為高效大語(yǔ)言模型MiniCPM-4在語(yǔ)音生成領(lǐng)域的重要探索,VoxCPM融合了層次化語(yǔ)言建模、有限標(biāo)量約束與局部擴(kuò)散Transformer等多項(xiàng)創(chuàng)新技術(shù),在克服傳統(tǒng)離散單元方法信息損失的同時(shí),有效增強(qiáng)了連續(xù)表征自回歸生成的穩(wěn)定性。本報(bào)告將介紹VoxCPM相關(guān)技術(shù)與實(shí)驗(yàn)結(jié)果,并展望多模態(tài)大模型的發(fā)展趨勢(shì)。


歡迎師生參加!

專(zhuān)家姓名 劉知遠(yuǎn) 講座時(shí)間 2025-10-19 09:00
講座地點(diǎn) 江蘇鎮(zhèn)江明都大飯店研發(fā)樓-401