金牌娱乐场官网信誉好不好,云鼎娱乐场金杯娱乐,新奥博娱乐场官网返佣

講座報(bào)告主題：面向穩(wěn)健大語(yǔ)言模型訓(xùn)練的優(yōu)化器
專(zhuān)家姓名：黃田進(jìn)
日期：2025-07-18 時(shí)間：14:30
地點(diǎn)：計(jì)算機(jī)學(xué)院221會(huì)議室
主辦單位：計(jì)算機(jī)科學(xué)與通信工程學(xué)院

主講簡(jiǎn)介：黃田進(jìn)博士，現(xiàn)任英國(guó)埃克塞特大學(xué)計(jì)算機(jī)科學(xué)系助理教授，主要從事人工智能與大模型優(yōu)化相關(guān)研究。此前，他在荷蘭埃因霍溫理工大學(xué)（TU/e）任博士后研究員，并于2023年在該校數(shù)學(xué)與計(jì)算機(jī)科學(xué)系獲得博士學(xué)位。黃博士已在ICML、NeurIPS、ICLR、LoG、Information Fusion等國(guó)際頂級(jí)會(huì)議與期刊發(fā)表論文三十余篇，并在2022年Learning on Graphs（LoG）大會(huì)上榮獲最佳論文獎(jiǎng)。研究專(zhuān)長(zhǎng)：主要從事人工智能與大模型優(yōu)化相關(guān)研究。

主講內(nèi)容簡(jiǎn)介：本報(bào)告將圍繞如何實(shí)現(xiàn)更穩(wěn)健的大語(yǔ)言模型訓(xùn)練展開(kāi)，重點(diǎn)揭示訓(xùn)練過(guò)程中普遍存在的梯度突刺（gradient spike）現(xiàn)象，以及其對(duì)模型和最終性能帶來(lái)的影響。此外，報(bào)告將從優(yōu)化器設(shè)計(jì)與梯度調(diào)控機(jī)制的角度切入，介紹SPAM（Spike-Aware Moment regularization）方法如何通過(guò)瞬態(tài)梯度突刺的檢測(cè)與裁剪，有效緩解異常梯度放大效應(yīng)，抑制由不均衡動(dòng)量累積導(dǎo)致的訓(xùn)練震蕩，顯著改善大模型的訓(xùn)練。在此基礎(chǔ)上，報(bào)告進(jìn)一步介紹Stable-SPAM，該方法通過(guò)引入自適應(yīng)突刺識(shí)別閾值與動(dòng)態(tài)縮放策略，可以更為穩(wěn)定的進(jìn)行大語(yǔ)言模型的低精度訓(xùn)練。

歡迎師生參加！

專(zhuān)家姓名	黃田進(jìn)	講座時(shí)間	2025-07-18 14:30
講座地點(diǎn)	計(jì)算機(jī)學(xué)院221會(huì)議室

新聞中心

新聞中心

講準(zhǔn)字【2025】第172號(hào)：面向穩(wěn)健大語(yǔ)言模型訓(xùn)練的優(yōu)化器

最新動(dòng)態(tài)

學(xué)校舉行中國(guó)—波黑智慧農(nóng)業(yè)技術(shù)與裝備“一帶一路”聯(lián)合實(shí)驗(yàn)室（籌）建設(shè)推進(jìn)會(huì)

五件作品在江蘇高校新聞優(yōu)秀作品中獲獎(jiǎng)

古巴駐上?？傤I(lǐng)事館一行訪(fǎng)問(wèn)我校

學(xué)校舉行江蘇高水平大學(xué)建設(shè)高峰計(jì)劃期滿(mǎn)績(jī)效評(píng)價(jià)專(zhuān)家論證會(huì)

附屬醫(yī)院獲批江蘇省皮膚病區(qū)域醫(yī)療中心

江蘇省集成電路學(xué)會(huì)智慧農(nóng)業(yè)芯片專(zhuān)委會(huì)成立

民革江蘇大學(xué)基層委員會(huì)2025年度工作總結(jié)會(huì)舉行

學(xué)校教師獲第十九屆江蘇省青年科技獎(jiǎng)

古巴駐上?？傤I(lǐng)事館一行訪(fǎng)問(wèn)我校