中文字幕精品一区二区精品_久久一二三区_亚洲韩日在线_日韩中文字幕视频

多模態(tài)人工智能前沿技術(shù)講習班精彩內(nèi)容新鮮出爐,歡迎報名參加!

日期:2023-08-25 16:23

近年來,人工智能理論、方法和技術(shù)快速發(fā)展,尤其是深度學習技術(shù)帶動了智能任務的性能快速提升和在社會多個領(lǐng)域的成功應用。由于實際應用場景數(shù)據(jù)動態(tài)變化、多模態(tài)協(xié)同的特點,多模態(tài)人工智能成為人工智能理論方法發(fā)展的重要方向。多模態(tài)人工智能面向復雜動態(tài)多模態(tài)場景的數(shù)據(jù)理解、學習和推理,涉及自然語言處理、計算機視覺、模式識別、語音識別和多模態(tài)融合等領(lǐng)域。最近,人工智能大模型的發(fā)展和應用再人工智能領(lǐng)域產(chǎn)生了巨大的影響,也將在多模態(tài)人工智能中發(fā)揮關(guān)鍵作用。

為了給本領(lǐng)域研究者、技術(shù)開發(fā)人員和研究生介紹多模態(tài)人工智能前沿理論方法和最新進展,中國自動化學會模式識別與機器智能專業(yè)委員會主辦這次前沿技術(shù)講習班。講習班于2023年9月22日-24日在昆明舉辦,由中國科學院自動化研究所劉成林研究員、華南理工大學金連文教授、云南大學信息學院張學杰教授和陶大鵬教授擔任學術(shù)主任,邀請了多名人工智能領(lǐng)域的知名專家作報告,使學員在了解學科熱點和基礎(chǔ)理論方法、提高學術(shù)水平的同時,增進與多模態(tài)人工智能領(lǐng)域頂尖學者之間的學術(shù)交流。



組織機構(gòu)

主辦單位:中國自動化學會模式識別與機器智能專委會

承辦單位:云南大學信息學院

協(xié)辦單位:云南云上云大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司



時間及地點

時間:2023年9月22號-24號

地點:云南省昆明市呈貢區(qū)南亞豪生酒店·南亞廳



注冊費標準

注冊費包括講課資料和3天會議期間午餐。



日程安排



注冊方式

注冊鏈接:

https://www.cacpaper.com/register/76/user/preRegist

注冊二維碼:


學術(shù)主任



劉成林
中國科學院自動化研究所研究員


簡介:

劉成林,中國科學院自動化研究所副所長,模式識別國家重點實驗室主任,研究員、博士生導師,中國科學院大學人工智能學院副院長。1989年、1992年、1995年分別在武漢大學、北京工業(yè)大學、中國科學院自動化研究所獲學士、碩士和博士學位。1996年至2004年先后在韓國科學技術(shù)院、日本東京農(nóng)工大學、日立中央研究所從事博士后和研發(fā)工作。2005年起在中國科學院自動化研究所任研究員。2008年獲得國家杰出青年科學基金。研究興趣包括模式識別、機器學習、文字識別與文檔分析等。在國內(nèi)外期刊和學術(shù)會議上發(fā)表論文300余篇,合著英文專著一本?,F(xiàn)任Pattern Recognition期刊和《自動化學報》的副主編,以及多個期刊的編委。任國際模式識別學會副主席,中國人工智能學會副理事長、會士,中國自動化學會會士、模式識別與機器智能專委會主任,中國圖象圖形學學會常務理事。美國電氣電子工程師協(xié)會會士 (IEEE Fellow)、國際模式識別學會會士(IAPR Fellow)。


金連文
華南理工大學教授



簡介:

金連文,華南理工大學二級教授,兼任廣東省圖像圖形學學會理事長、中國圖像圖形學學會(CSIG)常務理事、CSIG文檔圖像分析與識別專委會主任、中國自動化學會模式識別與機器智能專委會常委委員等職。主要研究領(lǐng)域為人工智能、計算機視覺、文字識別、文檔圖像理解等,在重要學術(shù)期刊及國際會議上發(fā)表學術(shù)論文300余篇,其中SCI Q1區(qū)+CCF A類論文100余篇,Google Scholar論文被引用數(shù)12000余次,H-Index 58,獲得授權(quán)發(fā)明專利70余項目。獲省部級科技獎5項(其中一等獎2項,二等獎3項);指導學生參加權(quán)威國際國內(nèi)學術(shù)競賽榮獲冠軍20余次。



陶大鵬
云南大學信息學院教授



簡介:

陶大鵬,教授、博士生導師,中國認知科學學會認知與類腦專委會委員,中國科學院深圳先進技術(shù)研究院客座研究員,中國科學院大學博導。主要從事人工智能、大數(shù)據(jù)、機器人等領(lǐng)域的研究工作,現(xiàn)任國際刊物IEEE Transactions on Emerging Topics in Computational Intelligence, IEEE Internet of Things編委。在SCI JCR1區(qū)和國際頂級會議發(fā)表論文超過50篇(其中包括ICCV、ECCV、CVPR、IEEE匯刊T-IP、T-NNLS、T-GRS、T-MM、T-IFS、T-CSVT等)。主持包括國家自然科學基金、云南省重點研發(fā)計劃等在內(nèi)的科研項目10余項。已獲省部級獎勵8項,2020年獲云南省科學技術(shù)獎(自然科學)二等獎,2017年獲得教育部高等學??茖W研究優(yōu)秀成果獎(自然科學)二等獎,2016年獲得廣東省科學技術(shù)獎(技術(shù)進步)二等獎,2015年度陜西省科學技術(shù)獎(自然科學)一等獎。



特邀報告




劉知遠
清華大學教授


報告題目:

語言基礎(chǔ)模型的重要特性


報告摘要:

近年來以BERT、GPT為代表的預訓練語言基礎(chǔ)模型,使人工智能技術(shù)進入“預訓練-微調(diào)”的全新范式,特別是最近ChatGPT引爆了全社會對基礎(chǔ)模型技術(shù)的關(guān)注。本報告重點介紹語言基礎(chǔ)模型的基本原理,在智能能力方面體現(xiàn)的強大通用特性,在模型框架、微調(diào)適配、推理計算等方面體現(xiàn)的模塊化計算特性,以及在多模態(tài)、工具學習、群體智能、安全性等方面體現(xiàn)的全新智能特性,并探討大模型未來的研發(fā)應用范式。

報告提綱:1. 人工智能與大模型;2. 大模型的通用特性;3. 大模型的參數(shù)模塊化計算特性;4. 大模型支持的多模態(tài)、工具學習、群體智能等智能特性;5. 大模型安全問題;6. 總結(jié)與未來展望。

報告人簡介:

劉知遠,清華大學計算機系副教授、博士生導師,主要研究方向為自然語言處理。2011年獲得清華大學博士學位,已在ACL、EMNLP、IJCAI、AAAI等人工智能領(lǐng)域的著名國際期刊和會議發(fā)表相關(guān)論文100余篇,Google Scholar統(tǒng)計引用超過3.2萬次。曾獲教育部自然科學一等獎(第2完成人)、中國中文信息學會錢偉長中文信息處理科學技術(shù)獎一等獎(第2完成人)、中國中文信息學會漢王青年創(chuàng)新獎,入選國家青年人才項目、北京智源研究院青年科學家、2020-2022連續(xù)3年Elsevier中國高被引學者、《麻省理工科技評論》中國區(qū)35歲以下科技創(chuàng)新35人榜單、中國科協(xié)青年人才托舉工程。


王井東
百度計算機視覺首席科學家


報告題目:

視覺大模型:自監(jiān)督預訓練以及在文心·CV大模型中的實踐


報告摘要:

本報告首先回顧計算機視覺領(lǐng)域里的自監(jiān)督預訓練算法最近幾年的進展,包括對比學習和圖像掩碼建模等。其次,介紹文心·CV大模型中的自監(jiān)督表征學習算法Context Autoencoder(CAE)和基于預訓練的目標檢測算法Group DETR等,同時,從學習物體部件的角度,給出幾個典型的自監(jiān)督預訓練算法(BEiT、MAE、CAE、MoCo v3及DINO)的特點(TMLR)。再次,講述基于CAE和Group DETR的工業(yè)視覺大模型、OCR文字識別大模型(MaskOCR)、人體大模型等。最后,分享圖文對比預訓練大模型在自動駕駛數(shù)據(jù)挖掘中的應用和基于多任務學習的交通感知大模型。


報告人簡介:

王井東,百度計算機視覺首席科學家,負責計算機視覺領(lǐng)域的研究、技術(shù)創(chuàng)新和產(chǎn)品研發(fā)。加入百度之前,曾任微軟亞洲研究院視覺計算組首席研究員。2001年和2004年在清華大學獲得學士和碩士學位,2007年在香港科技大學獲得博士學位。研究領(lǐng)域為計算機視覺、深度學習及多媒體搜索。他的代表工作包括高分辨率神經(jīng)網(wǎng)絡(luò)HRNet、基于transformer的圖像語義分割網(wǎng)絡(luò)OCRNet、以及基于近鄰圖的大規(guī)模最近鄰搜索SPTAG(最早把近鄰圖的方法用于實際搜索和推薦業(yè)務,是Bing搜索底層向量搜索的核心技術(shù))等。在微軟工作期間,科研成果10多次轉(zhuǎn)化到微軟的關(guān)鍵產(chǎn)品和業(yè)務中去,包括搜索、廣告、OCR、小冰聊天機器人等。在百度帶領(lǐng)團隊研發(fā)的技術(shù)已經(jīng)廣泛應用于百度的搜索、智能云以及自動駕駛等重要產(chǎn)品和業(yè)務中。他曾擔任過許多人工智能會議的領(lǐng)域主席,如 NeurIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等。他現(xiàn)在是IEEE TPAMI和IJCV的編委會成員,曾是IEEE TMM和IEEE TCSVT編委會成員。因在視覺內(nèi)容理解和檢索領(lǐng)域的杰出貢獻,他被遴選為國際電氣電子工程師學會和國際模式識別學會會士 (IEEE/IAPR Fellow)、國際計算機協(xié)會杰出會員 (ACM Distinguished Member)。


劉靜
中國科學院自動化研究所研究員
中國科學院大學教授



報告題目:

多模態(tài)預訓練的研究進展回顧與展望

報告摘要:

近年來,從預訓練模型到預訓練大模型,從文本、音頻、視覺等單模態(tài)大模型,到現(xiàn)在的圖文、圖文音等多模態(tài)預訓練大模型,無論在學術(shù)界還是企業(yè)界預訓練模型都得到了廣泛關(guān)注與爆發(fā)式發(fā)展。多模態(tài)預訓練通過聯(lián)合圖文音等多模態(tài)內(nèi)容進行模型學習,其發(fā)展在多模態(tài)理解、搜索、推薦、問答,語音識別與合成,人機交互等應用領(lǐng)域中具有潛力巨大的市場價值。本報告主要包含三方面內(nèi)容:分析多模態(tài)預訓練模型的重要性與必要性;回顧當前多模態(tài)預訓練的最新研究進展;多模態(tài)預訓練模型主要應用場景與未來展望。

報告人簡介:

劉靜,中科院自動化所研究員/博導,中國科學院大學崗位教授。研究方向多模態(tài)分析與理解,紫東太初大模型。曾獲中國電子學會自然科學一等獎,圖像圖形學會科學技術(shù)二等獎,2022年世界人工智能大會“卓越人工智能引領(lǐng)者獎SAIL”。承擔或參與多項國家自然科學基金項目、國家973課題、國家基金重大研究計劃、國家重點研發(fā)等。已發(fā)表高水平學術(shù)論文150余篇,谷歌學術(shù)引用12000+次,SCI他引次數(shù)5000+次,其中有三篇被ESI列為Top1%高被引論文。在視覺計算相關(guān)領(lǐng)域的多項國際學術(shù)競賽中榮獲冠軍10+項。



紀榮嶸
廈門大學教授


報告題目:

從ChatGPT到國產(chǎn)多模態(tài)基礎(chǔ)大模型


報告摘要:

隨著深度學習技術(shù)的快速發(fā)展,ChatGPT作為自然語言處理領(lǐng)域的重要突破,引起了廣泛關(guān)注。本次探討ChatGPT在自然語言處理領(lǐng)域中的重要性以及其所具有的優(yōu)秀特性,繼而引出國產(chǎn)多模態(tài)基礎(chǔ)大模型的研發(fā)意義,以及如何通過結(jié)合多模態(tài)數(shù)據(jù)和深度學習技術(shù)來實現(xiàn)新型國產(chǎn)化基礎(chǔ)模型的構(gòu)建。具體來說,將討論多模態(tài)數(shù)據(jù)的處理方法、模型構(gòu)建的關(guān)鍵技術(shù)以及如何實現(xiàn)緊致化部署等相關(guān)技術(shù)點。本講座的研究成果將為解決多模態(tài)大模型的部署難題和提高模型性能和效率提供借鑒和參考。


報告人簡介:

紀榮嶸,廈門大學南強特聘教授,科技處處長,人工智能研究院負責人。長期從事計算機視覺與機器學習等人工智能領(lǐng)域前沿技術(shù)研究,近年來發(fā)表TPAMI、IJCV、ACM匯刊、IEEE匯刊、CVPR、NeurIPS等會議長文百余篇。論文谷歌學術(shù)引用1.9萬余次。曾獲2016年教育部技術(shù)發(fā)明一等獎、2018年省科技進步一等獎、2020年省科技進步一等獎、2021年教育部技術(shù)發(fā)明二等獎、2022年霍英東青年科學獎。曾/現(xiàn)主持科技部科技創(chuàng)新2030重大項目、軍科委基礎(chǔ)加強項目、國家自然科學基金聯(lián)合重點、教育部裝備預研創(chuàng)新團隊項目等。任中國計算機學會A類國際會議CVPR和ACM Multimedia領(lǐng)域主席、中國圖象圖形學學會學術(shù)工委副主任、教育部電子信息類教指委委員,人工智能國家標準工作組聯(lián)合組長。


李崇軒
中國人民大學高瓴人工智能學院助理教授


報告題目:

擴散模型與視覺內(nèi)容生產(chǎn)


報告摘要:

擴散模型與AIGC 摘要:擴散概率模型逐步地對先驗分布去噪恢復數(shù)據(jù)分布。目前,這類模型在數(shù)據(jù)合成質(zhì)量、采樣的多樣性和數(shù)據(jù)密度估計等指標下取得了超越 VAE、GAN、FLOW 等經(jīng)典深度生成模型的結(jié)果,也部署于諸多的圖像、跨模態(tài)大規(guī)模生成模型。本次報告會介紹擴散概率模型的基本原理、加速推斷算法、大規(guī)模訓練和可控生成等AIGC應用的前沿進展。

報告人簡介:

李崇軒,中國人民大學高瓴人工智能學院助理教授,博士生導師。研究方向為概率機器學習。他的代表性工作有Triple-GAN,Analytic-DPM,ProlificDreamer等。李崇軒獲機器學習領(lǐng)域重要國際會議 ICLR杰出論文獎、吳文俊人工智能自然科學獎一等獎、吳文俊人工智能優(yōu)秀青年獎、北京市科技新星計劃、中國博士后創(chuàng)新人才支持計劃、中國計算機學會優(yōu)秀博士論文,主持國家自然科學基金面上項目。


王興剛
華中科技大學教授


報告題目:

高性能視覺目標檢測分割和跟蹤


報告摘要:

視覺目標檢測分割和跟蹤技術(shù)是計算機視覺中的基礎(chǔ)任務,具有重要的應用價值。本次報告將圍繞視覺目標檢測分割和跟蹤技術(shù),梳理近年來的技術(shù)發(fā)展路徑,并從預訓練大模型、開放場景感知、模型輕量化部署等方向做前沿技術(shù)介紹。


報告人簡介:

王興剛,華中科技大學,電信學院,教授,博導,Elsevier Image and Vision Computing期刊聯(lián)合主編。主要研究方向為計算機視覺和深度學習,研究工作見:https://xwcv.github.io。分別于2009年和2014年在華中科技大學獲得學士和博士學位,博士期間在美國天普大學、加州大學洛杉磯分校(UCLA)訪問研究。在IEEE TPAMI、CVPR、ICML等頂級期刊會議發(fā)表學術(shù)論文60余篇。谷歌學術(shù)引用次數(shù)超過1.7萬次,單篇論文最高引用1800余次。擔任CVPR 2022, ICCV 2023領(lǐng)域主席,Pattern Recognition (IF 7.196), Electronics (IF 2.412)期刊編委。入選中國科協(xié)“青年托舉人才工程”、 獲CSIG青年科學家獎、吳文俊人工智能優(yōu)秀青年獎、“微軟學者”獎(全亞洲10名獲獎者)、CCF-騰訊犀牛鳥科研基金優(yōu)秀獎、華為優(yōu)秀技術(shù)合作項目獎、湖北省自然科學二等獎(4/4),主持國家自然科學基金項目3項。


林倞
中山大學教授


報告題目:

視覺場景理解與推理問答


報告摘要:

近年來,以Transformer為核心的神經(jīng)網(wǎng)絡(luò)架構(gòu)快速發(fā)展,網(wǎng)絡(luò)規(guī)模日益龐大,并以此為基礎(chǔ)推動了無監(jiān)督/自監(jiān)督學習技術(shù)的跳躍式發(fā)展,逐步形成一套被稱為大模型或者基礎(chǔ)模型的技術(shù)范式。本報告將梳理這套基礎(chǔ)模型技術(shù)在視覺場景和推理問答中的應用。


報告人簡介:

林倞,中山大學計算機學院教授/博導,國際模式識別學會會士(IAPR Fellow),英國工程技術(shù)學會會士(IET Fellow)。長期從事計算機視覺、機器學習及智能機器人領(lǐng)域的應用基礎(chǔ)研究,承擔國家2030科技創(chuàng)新重大項目。在國際頂級學術(shù)期刊和會議發(fā)表論文300余篇,論文被引用累計3萬次;獲權(quán)威期刊Pattern Recognition年度最佳論文獎,多媒體計算旗艦會議ICME最佳論文鉆石獎,計算機視覺旗艦會議ICCV最佳論文獎提名;獲中國圖像圖形學會科學技術(shù)一等獎、吳文俊人工智能自然科學獎,省級自然科學一等獎。


劉成林

中國科學院自動化研究所研究員


報告題目:

魯棒自適應模式識別


報告摘要:

模式識別是人工智能領(lǐng)域的核心研究方向。傳統(tǒng)的模式識別和機器學習假設(shè)閉合類別集、獨立同分布、大數(shù)據(jù)訓練。然而在開放環(huán)境下,包括深度學習在內(nèi)的已有方法面臨一系列新的技術(shù)挑戰(zhàn)。尤其是,識別對象從閉合世界擴展到了開放世界,對新類別模式、異常和噪聲模式的建模與處理成為困難,由此產(chǎn)生了開放集識別、置信度估計、持續(xù)學習等大量研究工作。本報告對開放環(huán)境模式識別的研究問題進行分析,并專門針對開放魯棒性和類別增量學習進行深入討論。主要內(nèi)容包括:開放環(huán)境魯棒模式識別的研究問題,開放集識別的模型和算法,深度模型置信度校準,類別增量學習,開放環(huán)境模式識別的未來發(fā)展趨勢。


報告人簡介:

劉成林,中國科學院自動化研究所副所長,模式識別國家重點實驗室主任,研究員、博士生導師,中國科學院大學人工智能學院副院長。1989年、1992年、1995年分別在武漢大學、北京工業(yè)大學、中國科學院自動化研究所獲學士、碩士和博士學位。1996年至2004年先后在韓國科學技術(shù)院、日本東京農(nóng)工大學、日立中央研究所從事博士后和研發(fā)工作。2005年起在中國科學院自動化研究所任研究員。2008年獲得國家杰出青年科學基金。研究興趣包括模式識別、機器學習、文字識別與文檔分析等。在國內(nèi)外期刊和學術(shù)會議上發(fā)表論文300余篇,合著英文專著一本?,F(xiàn)任Pattern Recognition期刊和《自動化學報》的副主編,以及多個期刊的編委。任國際模式識別學會副主席,中國人工智能學會副理事長、會士,中國自動化學會會士、模式識別與機器智能專委會主任,中國圖象圖形學學會常務理事。美國電氣電子工程師協(xié)會會士 (IEEE Fellow)、國際模式識別學會會士(IAPR Fellow)。



聯(lián)系方式

聯(lián)系人李老師

聯(lián)系電話:18403433440 

電子郵箱 20224053@ynu.edu.cn