繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

NVIDIA 研究科學家主講 AI 繪畫模型 GauGAN2 核心技術及全景圖生成應用 | 直播預告

2022-09-24 19:37

近兩年來,AI 繪畫逐漸成為人工智能領域大熱的方向之一,多模態任務也成爲了行業熱點。從 Disco Diffusion ,到 OpenAI 的 DALL·E、CLIP、GLIDE、DALL·E 2 (unCLIP) 以及谷歌的 Imagen ,各種圖像生成模型層出不窮。這些模型可以將以自然語言形式表達的大量概念轉換為合適的圖像,效果十分驚艷。

在2019年3月的 GTC 大會上,NVIDIA 推出了一款 AI 繪畫工具 GauGAN。GauGAN 使任何人都能夠通過塗鴉模式創作出精美絕倫的風景畫。同年7月,NVIDIA 研究院首席科學家劉洺堉就主題《如何利用生成式對抗網絡 GAN 實現「AI神筆馬良」 GauGAN 的神奇效果》對 GauGAN 進行了深度講解。(想要觀看回看的朋友可以點擊「閲讀原文」進行回看)

去年11月,NVIDIA 推出 GauGAN 第二代 :GauGAN2,允許用户通過輸入文字和簡單的繪圖就能創建逼真的圖像。文本生成匹配圖像的模式也是 GauGAN2 主要的創新,生成的圖像會根據逐漸輸入的文本不斷發生變化,最終生成和文本匹配最佳的圖像。用户無需繪製想象場景的每個元素,只需輸入一個簡短的短語即可快速生成圖像的關鍵特徵和主題。甚至還可以在用塗鴉繪畫等生成圖像后,輸入文本進行相應的修改。

Demo 地址:

9月27日下午1點,智東西公開課策劃推出的「 NVIDIA GauGAN2 技術公開課」將正式開講。本次公開課邀請到 NVIDIA 研究科學家黃勛進行直播講解,主題為《 NVIDIA AI 繪畫模型 GauGAN2 核心技術及全景圖生成應用》。黃勛是 NVIDIA 研究科學家,康奈爾大學博士。在博士期間他曾獲得 NVIDIA 、Adobe 和 Snap 等獎學金。

本次公開課中,在對主流文本生成圖像模型進行介紹和比較之后,黃勛博士將會重點講解基於多模態輸入生成風景圖像的 GauGAN2 ,並對 GauGAN2 背后的核心技術:專家乘積模型,進行深入解讀。最后,黃博也會分享他們近期用 GauGAN2 生成全景圖的應用(GauGAN 360),並探討未來的方向。

「NVIDIA GauGAN2 技術公開課」將以視頻直播形式進行,包含40分鍾主講和20分鍾問答。同時,針對本次公開課,也組建了專屬交流羣,屆時主講人黃勛博士將加入,歡迎感興趣的朋友申請。

公開課信息

主 題

《NVIDIA AI 繪畫模型 GauGAN2 核心技術及全景圖生成應用》

提 綱

1、主流文本生成圖像模型對比

2、GauGAN2 基於多模態輸入生成風景圖像

3、專家乘積模型:GauGAN2 背后核心技術

4、GauGAN2 的全景圖生成應用及未來方向

主 講 人

黃勛,NVIDIA 研究科學家,康奈爾大學博士,北京航空航天大學本科;博士期間曾獲 NVIDIA ,Adobe,Snap 等獎學金。

直 播 時 間

9月27日13:00-14:00

加入專屬交流羣

對本次公開課感興趣的朋友,可以掃描下方二維碼,添加小助手米婭進行報名。已添加過米婭的老朋友,可以給米婭私信,發送「NVIDIA2209」即可報名。

同時,爲了方便大家交流和諮詢,針對「NVIDIA GauGAN2 技術公開課」還設置了專屬交流羣,將會邀請主講人加入。希望加入交流羣與主講人直接認識和交流的朋友,也可以與米婭進行申請。

點個「在看」和大家一起聊聊

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。