【導讀】2024年7月2日,由中國科學技術協會、廣西壯族自治區人民政府主辦,中國自動化學會承辦的第二十六屆中國科協年會通用大模型未來演進路線——數據、算力、算法論壇在廣西南寧召開。會議特別邀請歐洲科學院院士、中國自動化學會副理事長、華南理工大學教授陳俊龍,作主題為“新型人工智能技術助力產業創新發展”的報告,報告聚焦新型人工智能技術前沿,探討了人工智能算力的發展趨勢,數據、算法的并行、分布特性和重要性,以及最近興起的生成式人工智能的應用和平臺,強調了數據、算力和算法對人工智能發展的重要性,并提出這些要素的持續進步將推動人工智能技術在各個領域的廣泛應用,催生新技術、新產業、新業態和支撐經濟高質量發展。
生成式人工智能(Generative AI)的概念自2014年生成對抗網絡(GAN)提出以來,逐漸得到了廣泛關注和發展。與傳統的決策型人工智能模型不同,決策型模型通過數據的條件概率分布來進行分類決策,而生成式模型則基于數據的聯合概率分布進行創作,兩者對比如圖1所示。這一創新不僅僅限于數據的決策,還包括數據的生成,從而兼具判別與生成的功能,開啟了生成式人工智能的新紀元。
圖1 決策式AI與生成式AI
一、生成式人工智能的起源與發展
自2022年12月ChatGPT的推出,生成式人工智能進入了爆發式增長期。生成式AI在智能駕駛、電商應用、人臉識別、情感智能、文本分類等領域展現出強大的替代潛力。這些是得力于2014生成對抗網絡的誕生,在生成對抗網絡的研究中,不同組合的GAN模型與擴散模型相結合,取得了諸多成果。例如,通過對一百個人臉進行組合,可以生成出全新且不存在于現實中的人臉圖像,這一技術在六七年前就已存在并廣泛應用于圖像生成領域。
生成式人工智能在文本與圖像生成方面取得了顯著進展。除了傳統的文本生成文本模型,還出現了文本生成圖像的模型,如ChatGPT和文心一言等。此外,文本生成視頻技術的發展也日新月異,未來可能會實現更復雜的任務和動作生成。通過描述場景生成視頻,這種技術在設計、電玩場景創建等領域展現出廣闊的應用前景。
生成對抗網絡自2014年問世以來,在圖像處理領域得到了廣泛應用。利用生成式模型,可以實現圖像的超分辨率、去噪、遮擋補全和風格遷移等功能。例如,將普通圖像轉換為油畫風格,或者實現不同季節的圖像轉換,如圖2所示。這些應用大大推動了生成對抗網絡在圖像處理中的發展,盡管視頻生成的研究直到2023年才逐漸受到關注。
圖2 人工智能的創作本領
隨著生成式人工智能的發展,隱私保護和倫理問題變得尤為重要。例如,短片中顯示詐騙集團利用生成式AI技術進行面部替換和聲音生成。如何應對這些挑戰成為我們需要關注的方向。
二、生成式人工智能在各領域的應用與挑戰
ChatGPT的誕生標志著生成式人工智能的又一里程碑。ChatGPT的發展經歷了從2018年GPT模型的演進,到2022年加入Chat功能,引發了生成式人工智能產品的爆發,其發展歷程如圖3所示。ChatGPT擁有1700多億參數,基于45TB的公共數據,能夠生成高質量的模型。國內企業也紛紛布局生成式人工智能,推出了諸如盤古大模型、紫東太初、文心一言、通義千問、星火等具有國際競爭力的模型。
圖3 ChatGPT發展歷史
生成式人工智能的出現也改變了市場生態模式。例如,傳統互聯網公司如Discord擁有650名員工,年營收1億美元,而生成式人工智能公司Midjourney僅有11名員工,卻同樣實現了1億美元的年營收。這表明未來的小型精簡公司將逐漸嶄露頭角,并在市場中占據重要地位。
在國內,盡管企業如百度、科大訊飛和阿里還未完全開放API供開發者使用,但未來隨著生成式人工智能技術的普及,相關企業將逐步開放API,促進行業發展。生成式人工智能在設計、繪畫、劇本編寫、特效生成和燈光等創意領域具有廣泛應用,極大地降低了制作成本,提高了工作效率。
生成式人工智能不僅可以將輸入內容轉化為小說、電影和藝術品,還能通過圖像關聯生成不同的敘述。這在國外已經得到了廣泛應用,而在國內,國家發布的大模型數量也在快速增加,顯示出強大的競爭力,如圖4所示。
圖4 大語言模型樹
生成式人工智能不僅在設計和創作領域發揮重要作用,還在工程領域展現出巨大的潛力。行業內開始探討將大模型分解為小模型,利用行業數據生成行業專用的小模型。這種垂域大模型的應用將極大地推動AI for Engineering的發展,實現更高效的工程設計和應用。
在人才方面,人工智能領域的人才需求量巨大,人才的投入和培養至關重要。計算平臺、算力平臺、數據和算法是推動人工智能發展的三大支柱,而人才則是其中最為重要的一環。
文生任務和文生行動是生成式人工智能的未來應用方向之一。例如,英偉達在發布會上展示了利用生成式人工智能訓練的機器人模型,這些機器人能夠通過觀察人類動作進行學習。迪士尼樂園的人工智能研究院也在進行類似的研究,未來我們有望看到機器人與人類、機器人與機器人以及機器人與數字人之間的交互。
三、生成式人工智能的未來發展與挑戰
生成式人工智能的發展使得文生視頻技術逐漸成熟。通過文本生成視頻,用戶可以用簡單的文字描述生成高質量的視頻內容,如圖5所示。例如,一個女士走在東京街道上的情景可以通過文本描述生成相應的視頻。盡管目前生成式人工智能在時間和空間問題上還存在一些挑戰,但隨著技術的進步,這些問題將逐步得到解決。
圖5 文字描述生成視頻內容
生成式人工智能將在面向消費者的應用領域發揮重要作用,輔助人類進行各種任務。這涉及到自動化和智能化的發展方向,通用人工智能將逐步走向消費者,優化用戶體驗,實現更廣泛的應用。
未來,計算機和手機市場將逐漸嵌入生成式人工智能功能。例如,PC市場可能會加入AIGC功能,只需插入一張卡片即可支持大規模數據計算。手機市場同樣將受益于生成式人工智能技術的發展,用戶可以在手機上選擇并應用通用大模型。這為國內手機廠商提供了巨大的商機,推動智能手機向更高水平發展。
AI for Engineering概念強調行業知識的重要性,如圖6所示。頭部企業的大模型將為中小型企業提供行業數據支持,生成行業專用的小模型,推動行業應用的發展。
圖6 AI for Industry and Engineering
除了算法、算力和數據,人才是推動人工智能發展的關鍵因素。人工智能領域的人才培養和投入至關重要,各級政府和企業應高度重視人才培養,以滿足快速發展的人工智能產業需求。人才是發展的第一資源,人工智能對人才的要求程度較高,需要對技術、商業有著深刻的理解。
總結而言,生成式人工智能的發展已經對各個領域產生了深遠影響。從設計、創作到工程應用,生成式人工智能正在改變我們的工作方式和生活方式。隨著技術的不斷進步和應用的拓展,生成式人工智能將在未來發揮更加重要的作用。
(本文根據作者所作報告速記整理而成)