메뉴 본문 하단

Newmedia of the world

소규모 언론사와 이미지 생성 AI의 대중화

  • 이성규 (미디어스피어 대표)
Newmedia of the World 1

예상보다 빨리 현실이 됐다. 이미지 생성 AI가 쓰임새를 찾아가는 데 채 수 개월도 걸리지 않을 거라고 누가 상상했을까. 텍스트 생성 AI와는 그 속도가 비교되지 않을 정도다. 일러스트를 대체하는 용도로 주목받게 될 것이라는 건 누구나 예측했던 바다. 하지만 지금은 그 예측을 넘어 예술가들이 나서 가지각색의 용도를 상상하며 활용의 범위를 넓혀가는 중이다. 마치 모두가 기다렸다는 듯이….

혁신적인 AI 모델로 손꼽혔던 ‘DALL-E2’가 발표된 건 올해 4월1)이었다. 우주인이 달에서 말을 타는 샘플 이미지를 소개하며 AI의 잠재력과 상상력을 동시에 과시했다. 이때만 하더라도 ‘이런 것도 가능하구나’ 하는 수준이었다. 인류의 찬사를 얻기 위해 의도적으로 공개한 기술처럼 보이기까지 했다. DALL-E2 코드에 대한 접근은 제한적이었고, 기술적 가능성 또한 설계자만 이해할 수 있었기에 더욱 그랬다.

대중화의 문을 열어젖힌 건 ‘크레용(Craiyon)’이었다. ‘DALL-E mini’라는 이름으로 출발했지만 DALL-E 모델을 개발한 오픈 AI(OPEN AI)측의 항의를 받고 곧 타이틀을 교체했다. 우스꽝스럽고 유쾌한 실사 합성 이미지를 생성하는데 훌륭한 결과를 보여준 크레용(Craiyon)은 공개 직후 밈(meme)을 타며 전 세계로 퍼져나갔다. 이미지의 디테일이 떨어진다는 혹평도 있었지만 장난감으론 제격이었다. 하지만 상업적 활용 가치를 증명한 건 뭐라 해도 미드저니(Midjourney)2)였다. 공개 버전이 발표된 지난 7월부터 예술가들의 보조도구처럼 다뤄졌다. 베타 버전 단계에서 누구나가 이용할 수 있도록 열어 두었고, 그 사이에 생성된 이미지들이 인터넷을 떠돌았다. 유료로 전환한 뒤에도 미드저니(Midjourney) 커뮤니티는 문전성시를 이뤘고, 지금도 많은 예술가들은 이 모델을 돈을 주고 사용하고 있다.

그 가운데 스테이블 디퓨전(Stable Diffusion)은 이미지 생성 AI의 백미라 할 만 하다. 영국의 스타트업이 개발해 지난 8월 소스 코드까지 공개된3) 스테이블 디퓨전(Stable Diffusion)은 앞선 모든 AI 모델을 뛰어넘을 만큼 강력한 확산세를 기록하는 중이다. 가격과 코드의 진입장벽을 완전히 걷어낸 덕이다. 이미 수십 개의 애플리케이션이 만들어졌고, 다양한 플러그인이 개발돼 이미지 소프트웨어에 부착되고 있다. 마음만 먹으면 노트북에 다운받아서 자유롭게 이미지를 만들어낼 수도 있다.4) 더 이상의 기술 장벽이 존재하지 않는 국면으로 진입하는 중이다.

다음 단계는 ‘문자에서 영상으로(Text to Video)’ 즉 영상 생성 AI다. 런웨이(Runway) 라는 기업은 지난 9월 9일 AI가 생성한 티저 영상을 공개했다.5) ‘도시의 도로를 읽어오라(Import city street)’는 명령어를 쳤더니 세상 어디에 존재하는지 모를 어떤 낯선 도시의 길거리를 영상으로 보여준다. 페이스북의 모기업 메타도 지난 9월 29일 ‘Make-A-Video’라는 영상 자동 생성 AI를 발표하며 경쟁의 불씨를 댕겼다. 영상을 만들어 내는 것은 여전히 기술 난이도가 높은 영역으로 평가받고 있지만 머지않은 시간 안에 이미지 생성 AI 만큼의 새로운 용도를 발견하게 될 것으로 보인다.

Newmedia of the World 2
△ 런웨이(Runway)의 티저 영상 출처 : 런웨이

우리가 주목해야 하는 건 기술 그 자체가 아니다. 그것을 활용하는 주체와 용도다. AI 모델이 인간의 노동을 대체한다는 거대담론과는 대조적으로 예술가들은 이 기술을 적극적으로 수용, 아니 주도하고 있다. 미드저니(Midjourney)와 스테이블 디퓨전(Stable Diffusion)을 이용해 삽화를 제작하고, 포스터를 디자인하며, 새로운 예술적 상상력의 영감을 얻고 있다. AI의 보조로 창작한 예술품을 SNS에 공개하고, 서로 품평을 주고받는다. ‘노동 대체론’의 1차 타깃이 될 것 같았던 당사자들이 오히려 적극적으로 기술을 이용하고 쓸모를 입증하고 있다.

그 이면에는 예술가들의 열악한 삶이 존재한다. 외주를 받아 일러스트, 로고, 캐릭터 이미지를 납품해왔던 예술가들은 그들 작품에 대한 값싼 대가를 메우기 위해 AI를 이용했다. 시간을 줄여주고 비용을 절약할 수 있어서다. 노동에 대한 대가를 제대로 보상받지 못하는 프리랜서 아티스트들에게 이러한 AI는 이제 필수품이 되어가고 있다.

높은 인건비를 감당하지 못해 광고 콘텐츠를 제작하지 못하던 일부 소규모 에이전시들도 이미지 생성 AI를 적극적으로 도입하고 있다. 월 10달러 정도면 만족스러운 광고 콘텐츠를 수십 초 안에 뽑아낼 수 있기에 망설일 이유도 없다. 이렇듯, AI는 의외의 주체들에 의해 다소 예견하지 못했던 방식으로 그 쓰임새가 널리 확산하는 중이다.

오히려 타격은 거대 기업을 향한다. 높은 저작권료를 바탕으로 잡지, 신문, 방송용 이미지를 판매해왔던 게티이미지(Gettyimages)나 셔터스톡(Shutterstock)과 같은 이미지 뱅크 기업들은 존재의 위협을 느껴야 할 처지에 놓였다. 이를 감지한 듯 게티이미지는 자사 이미지 뱅크에 AI 도구로 제작된 모든 콘텐츠의 업로드와 판매를 금지했다. 한발 더 나아가 이들 이미지의 법적 문제를 거론하면서 “AI 생성 콘텐츠의 합법성에 대한 우려가 있다”는 입장6)을 꺼내놓기도 했다.

이처럼 기술은 당대 사회의 여러 문제들과 결합하며 수용의 흐름을 만들어간다. 틀에 박힌 담론의 빈틈을 타고 흐르기도 한다. 상대적 약자에게 막대한 타격을 줄 것만 같았던 AI는 오히려 그들에게 권능을 부여하고, 열악한 삶을 개선하는 희망의 도구로 채택되고 있다. 언론 산업도 예외는 아닐 것이다. 높은 비용의 장벽으로 세련된 표지 이미지와 삽화, 디지털 영상은 언감생심으로 구매조차 못했던 소규모 언론사들에게 이미지 생성 AI 모델은 더 혁신적인 도전을 시도할 수 있는 가성비 높은 자양분이 될 수도 있을 것이다. 그것의 오남용을 막기 위한 윤리의식만 갖춘다면 말이다.


지난 기사 · 연관 기사