简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

NVIDIA 研究科学家主讲 AI 绘画模型 GauGAN2 核心技术及全景图生成应用 | 直播预告

2022-09-24 19:37

近两年来,AI 绘画逐渐成为人工智能领域大热的方向之一,多模态任务也成为了行业热点。从 Disco Diffusion ,到 OpenAI 的 DALL·E、CLIP、GLIDE、DALL·E 2 (unCLIP) 以及谷歌的 Imagen ,各种图像生成模型层出不穷。这些模型可以将以自然语言形式表达的大量概念转换为合适的图像,效果十分惊艳。

在2019年3月的 GTC 大会上,NVIDIA 推出了一款 AI 绘画工具 GauGAN。GauGAN 使任何人都能够通过涂鸦模式创作出精美绝伦的风景画。同年7月,NVIDIA 研究院首席科学家刘洺堉就主题《如何利用生成式对抗网络 GAN 实现“AI神笔马良” GauGAN 的神奇效果》对 GauGAN 进行了深度讲解。(想要观看回看的朋友可以点击“阅读原文”进行回看)

去年11月,NVIDIA 推出 GauGAN 第二代 :GauGAN2,允许用户通过输入文字和简单的绘图就能创建逼真的图像。文本生成匹配图像的模式也是 GauGAN2 主要的创新,生成的图像会根据逐渐输入的文本不断发生变化,最终生成和文本匹配最佳的图像。用户无需绘制想象场景的每个元素,只需输入一个简短的短语即可快速生成图像的关键特征和主题。甚至还可以在用涂鸦绘画等生成图像后,输入文本进行相应的修改。

Demo 地址:

9月27日下午1点,智东西公开课策划推出的「 NVIDIA GauGAN2 技术公开课」将正式开讲。本次公开课邀请到 NVIDIA 研究科学家黄勋进行直播讲解,主题为《 NVIDIA AI 绘画模型 GauGAN2 核心技术及全景图生成应用》。黄勋是 NVIDIA 研究科学家,康奈尔大学博士。在博士期间他曾获得 NVIDIA 、Adobe 和 Snap 等奖学金。

本次公开课中,在对主流文本生成图像模型进行介绍和比较之后,黄勋博士将会重点讲解基于多模态输入生成风景图像的 GauGAN2 ,并对 GauGAN2 背后的核心技术:专家乘积模型,进行深入解读。最后,黄博也会分享他们近期用 GauGAN2 生成全景图的应用(GauGAN 360),并探讨未来的方向。

「NVIDIA GauGAN2 技术公开课」将以视频直播形式进行,包含40分钟主讲和20分钟问答。同时,针对本次公开课,也组建了专属交流群,届时主讲人黄勋博士将加入,欢迎感兴趣的朋友申请。

公开课信息

主 题

《NVIDIA AI 绘画模型 GauGAN2 核心技术及全景图生成应用》

提 纲

1、主流文本生成图像模型对比

2、GauGAN2 基于多模态输入生成风景图像

3、专家乘积模型:GauGAN2 背后核心技术

4、GauGAN2 的全景图生成应用及未来方向

主 讲 人

黄勋,NVIDIA 研究科学家,康奈尔大学博士,北京航空航天大学本科;博士期间曾获 NVIDIA ,Adobe,Snap 等奖学金。

直 播 时 间

9月27日13:00-14:00

加入专属交流群

对本次公开课感兴趣的朋友,可以扫描下方二维码,添加小助手米娅进行报名。已添加过米娅的老朋友,可以给米娅私信,发送“NVIDIA2209”即可报名。

同时,为了方便大家交流和咨询,针对「NVIDIA GauGAN2 技术公开课」还设置了专属交流群,将会邀请主讲人加入。希望加入交流群与主讲人直接认识和交流的朋友,也可以与米娅进行申请。

点个“在看”和大家一起聊聊

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。