실시간 AI 아트 툴 ‘고갱(GauGAN)’, 시그라프 2019서 수상
실시간 AI 아트 툴 ‘고갱(GauGAN)’, 시그라프 2019서 수상
  • 최광민 기자
  • 승인 2019.08.02 10:46
  • 댓글 0
이 기사를 공유합니다

엔비디아, 시그라프 컨퍼런스의 실시간 라이브 콘테스트에서 ‘베스트 오브 쇼(Best of Show)’ 및 ‘오디언스 초이스(Audience Choice) 부문을 수상
'시그라프(SIGGRAPH) 2019' 행사이미지(사진:홈페이지 캡처)
'시그라프(SIGGRAPH) 2019' 행사이미지(사진:홈페이지 캡처)

올해 초 NVIDIA 연구원이 개발한 실시간 인공지능(AI) 아트 애플리케이션 ‘고갱(GauGAN)’이 7월 28부터 8월 1일까지 LA컨벤션센터(Los Angeles Convention Center)에서 열린 '시그라프(SIGGRAPH) 2019'에서 2개의 상을 수상했다.

고갱은 시그라프 프로패셔널 그래픽 컨퍼런스에서 시연되며 큰 호응을 이끌었다고 한다. 시그라프 컨퍼런스의 실시간 라이브 콘테스트에서 ‘베스트 오브 쇼(Best of Show)’ 및 ‘오디언스 초이스(Audience Choice) 부문을 수상했으며, 엔비디아의 류밍유(Ming-Yu Liu), 크리스 헤버트(Chris Hebert), 가브리일 클림로프(Gavriil Klimov) 연구원과 UC 버클리의 박태성(Taesung Park) 연구원은 고갱 앱을 선보이며 박수 갈채를 받았다'

대략적인 스케치를 놀랍고 사실적인 장면으로 바꿔주는 이 AI 페인팅 웹 앱은 엔비디아 리서치(NVIDIA Research)를 생성적 적대 신경망(GAN, generative adversarial networks)을 기반으로 실연하기 위해 개발됐다.

한 달 전 베타 버전이 공개됐을 때부터 엔비디아 AI 플레이그라운드(NVIDIA AI Playground)에서는 고갱을 통해 50만 개 이상의 이미지가 생성됐으며, 최고의 영화 스튜디오와 비디오 게임 업체의 아트 디렉터와 컨셉 아티스트들은 아이디어를 프로토타입하고 합성 장면을 빠르게 변경하는 도구로 고갱을 이미 활용하고 있다.

올해 초 NVIDIA 연구원이 개발한 GauGAN은 경관을 포함한 복잡하고 사실적인 이미지를 생성할 수 있는 최초의 시맨틱 이미지 합성 모델이다(사진:엔비디아)
올해 초 NVIDIA 연구원이 개발한 GauGAN은 경관을 포함한 복잡하고 사실적인 이미지를 생성할 수 있는 최초의 시맨틱 이미지 합성 모델이다(사진:엔비디아)

스타워즈, 트랜스포머, 어벤져스 등의 작품에 참여한 컨셉 아티스트 겸 모델러인 콜리 워츠(Colie Wertz)는 “고갱은 불쑥 나타나 전혀 예상치 못했던 방향으로 나에게 영감을 주었다. 이를 통해 나는 이전에는 상상조차 하지 못했던 것을 쉽게 구현해 낼 수 있었다”고 가 말했다. 또 그는 고갱 랜드스케이프(GauGAN landscape)를 기반으로 공상 선박 디자인을 최근 개발했으며, 이를 소셜 미디어에 공유했다.

시그라프 컨퍼런스 참석자들은 엔비디아 부스에서 고갱을 직접 체험해 볼 수 있었으며, 고갱은 엔비디아 텐서 코어(Tensor Cores)를 장착한 쿼드로(Quadro) RTX GPU가 탑재된 HP RTX 워크스테이션에서 운영되고 있다. 사용자들은 고갱을 통해 제작한 작품을 공유하고 해시태그 #SIGGRAPH2019, #GauGAN, @NVIDIA Design를 입력하여 AI 아트 콘테스트에 참가할 수 있다. 

예술 작품을 창조하는 AI 아티스트 고갱, 후기 인상주의 화가 폴 고갱의 이름을 딴 고갱(GauGAN)은 장면의 레이아웃을 묘사하는 레이블이 지정된 스케치인 분할 지도(segmentation map)로부터 포토리얼리스틱 이미지를 제작하는 애플리케이션이다. 사람들은 페인트브러쉬와 페인트 버킷 툴을 통해 강, 풀, 바위, 구름을 포함한 라벨로 자신만의 풍경을 디자인할 수 있다. 스타일 트렌스퍼(style transfer) 알고리즘은 크리에이터들이 필터를 적용하거나 생성된 이미지의 색상 구성을 수정하거나 포토리얼리스틱 장면을 그림으로 전환할 수 있게 한다.

이번 시그라프에서 전시된 최신 애플리케이션을 통해 사용자들은 완벽한 일몰 사진 혹은 좋아하는 화가의 스타일을 모방하는 등 자신만의 창조물 위에 필터 씌우고 이를 업로드 할 수 있었다. 뿐만 아니라 사용자들은 자신의 풍경 이미지를 올릴 수 있었다. AI는 분할 지도를 통해 소스 이미지를 변환하며 이는 사용자 예술작품의 기초로 사용된다.

연구자들은 게임 개발자, 조경 디자이너, 도시 계획자들이 이 기술의 혜택을 누릴 것으로 예상했지만 고갱은 환자를 치료하고 스트레스를 완화하는 툴에 활용되는 등 훨씬 더 광범위하게 보급되었다.

특히, 파이토치(PyTorch) 딥 러닝 프레임워크(deep learning framework)를 통해 개발된 고갱의 뉴럴 네트워크(neural network)는 엔비디아 DGX-1 딥 러닝 시스템을 이용해 백만 개 이미지를 학습했다. GTC에서 전시된 데모는 엔비디아 타이탄(TITAN) RTX GPU에서 실행됐으며 웹 애플리케이션은 아마존웹서비스(AWS)를 통해 엔비디아 GPU에서 호스팅됐다.

류 연구원은 박태성, 왕팅춘(Ting-Chun Wang), 주옌쥔(Jun-Yan Zhu) 연구원과 함께 딥 뉴럴 네트워크와 애플리케이션을 개발했다. 이들은 고갱의 뉴럴 네트워크에 대한 소스 코드를 공개하여 다른 개발자가 비상업적인 용도에서 해당 애플리케이션을 실험하고 구축할 수 있도록 했다.

한편, 고갱 데모는 엔비디아 AI 플레이그라운드(바로가기)에서 직접 체험해볼 수 있으며, 아래 영상으로 확인할 수 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.