先驗和知識引導的多模態(tài)內(nèi)容生成技術(shù)

來源：人工智能學院點擊：

講座名稱：先驗和知識引導的多模態(tài)內(nèi)容生成技術(shù)

講座人：楊易教授

講座時間：11月27日19:30

地點：騰訊會議直播（ID：182 107 714）

講座人介紹：

楊易，浙江大學求是講席教授（二級教授），國家特聘專家。目前擔任浙江大學計算機學院副院長、微軟-教育部視覺感知重點實驗室主任、人工智能省部共建協(xié)同創(chuàng)新中心副主任。曾獲教育部全國優(yōu)秀博士論文，浙江省自然科學一等獎，澳大利亞科研終身成就獎，澳大利亞研究理事會青年職業(yè)獎，澳大利亞計算機學會顛覆創(chuàng)新金獎，谷歌學者研究獎和AWS機器學習研究獎等二十余次人工智能領(lǐng)域國際獎項。Google Scholar 引用59000余次，H-index 118，近五年連續(xù)入選Clarivate Analytics全球高被引學者。國際科研競賽中累計獲得40余次獎項，含20次世界冠軍。擔任7種重要國際期刊的副主編或領(lǐng)域主編，以及CVPR、ICCV、IJCAI，ACM MM等重要國際學術(shù)會議的重要職務(wù)等20余次。

講座內(nèi)容：

多重知識表達旨在融合多種知識表達，用于突破單一知識模式的局限，建立具有知識協(xié)同、領(lǐng)域外推的人工智能模型。人類先驗知識和數(shù)據(jù)結(jié)合是實現(xiàn)多重知識表達的一種有效方式。首先，本報告將探討多模態(tài)內(nèi)容生成技術(shù)中面臨的挑戰(zhàn)和問題，并分析多重知識表達的優(yōu)勢和特點。隨后，本報告將討論多模態(tài)內(nèi)容生成的研究進展，重點關(guān)注融合大語言模型和人類先驗知識的內(nèi)容生成技術(shù)，并舉例討論其有效性。在數(shù)字人重建方面，本報告將探討融合幾何等先驗信息的方法在數(shù)字人驅(qū)動中的應(yīng)用。在跨媒體數(shù)字人生成方面，本報告將討論從音頻、文本等輸入到生成數(shù)字人圖像、視頻等表達形式的方法和技術(shù)。本報告還將結(jié)合實際案例，討論專用知識嵌入方法和結(jié)構(gòu)化表達機制等。最后，本報告將展望先驗和知識引導多模態(tài)內(nèi)容生成的研究前景。

主辦單位：人工智能學院

上一條：感悟鐵人魅力　解析精神密碼

下一條：當代社會問題解析與推進中國社會治理現(xiàn)代化