熱門資訊> 正文
2022-09-24 19:37
近兩年來,AI 繪畫逐漸成為人工智能領域大熱的方向之一,多模態任務也成爲了行業熱點。從 Disco Diffusion ,到 OpenAI 的 DALL·E、CLIP、GLIDE、DALL·E 2 (unCLIP) 以及谷歌的 Imagen ,各種圖像生成模型層出不窮。這些模型可以將以自然語言形式表達的大量概念轉換為合適的圖像,效果十分驚艷。
在2019年3月的 GTC 大會上,NVIDIA 推出了一款 AI 繪畫工具 GauGAN。GauGAN 使任何人都能夠通過塗鴉模式創作出精美絕倫的風景畫。同年7月,NVIDIA 研究院首席科學家劉洺堉就主題《如何利用生成式對抗網絡 GAN 實現「AI神筆馬良」 GauGAN 的神奇效果》對 GauGAN 進行了深度講解。(想要觀看回看的朋友可以點擊「閲讀原文」進行回看)
去年11月,NVIDIA 推出 GauGAN 第二代 :GauGAN2,允許用户通過輸入文字和簡單的繪圖就能創建逼真的圖像。文本生成匹配圖像的模式也是 GauGAN2 主要的創新,生成的圖像會根據逐漸輸入的文本不斷發生變化,最終生成和文本匹配最佳的圖像。用户無需繪製想象場景的每個元素,只需輸入一個簡短的短語即可快速生成圖像的關鍵特徵和主題。甚至還可以在用塗鴉繪畫等生成圖像后,輸入文本進行相應的修改。
Demo 地址:
9月27日下午1點,智東西公開課策劃推出的「 NVIDIA GauGAN2 技術公開課」將正式開講。本次公開課邀請到 NVIDIA 研究科學家黃勛進行直播講解,主題為《 NVIDIA AI 繪畫模型 GauGAN2 核心技術及全景圖生成應用》。黃勛是 NVIDIA 研究科學家,康奈爾大學博士。在博士期間他曾獲得 NVIDIA 、Adobe 和 Snap 等獎學金。
本次公開課中,在對主流文本生成圖像模型進行介紹和比較之后,黃勛博士將會重點講解基於多模態輸入生成風景圖像的 GauGAN2 ,並對 GauGAN2 背后的核心技術:專家乘積模型,進行深入解讀。最后,黃博也會分享他們近期用 GauGAN2 生成全景圖的應用(GauGAN 360),並探討未來的方向。
「NVIDIA GauGAN2 技術公開課」將以視頻直播形式進行,包含40分鍾主講和20分鍾問答。同時,針對本次公開課,也組建了專屬交流羣,屆時主講人黃勛博士將加入,歡迎感興趣的朋友申請。
公開課信息
主 題
《NVIDIA AI 繪畫模型 GauGAN2 核心技術及全景圖生成應用》
提 綱
1、主流文本生成圖像模型對比
2、GauGAN2 基於多模態輸入生成風景圖像
3、專家乘積模型:GauGAN2 背后核心技術
4、GauGAN2 的全景圖生成應用及未來方向
主 講 人
黃勛,NVIDIA 研究科學家,康奈爾大學博士,北京航空航天大學本科;博士期間曾獲 NVIDIA ,Adobe,Snap 等獎學金。
直 播 時 間
9月27日13:00-14:00
加入專屬交流羣
對本次公開課感興趣的朋友,可以掃描下方二維碼,添加小助手米婭進行報名。已添加過米婭的老朋友,可以給米婭私信,發送「NVIDIA2209」即可報名。
同時,爲了方便大家交流和諮詢,針對「NVIDIA GauGAN2 技術公開課」還設置了專屬交流羣,將會邀請主講人加入。希望加入交流羣與主講人直接認識和交流的朋友,也可以與米婭進行申請。
點個「在看」和大家一起聊聊