하지만, 〈웰컴 투 체첸〉의 감독 데이비드 프랑스(David France)는 딥페이크 기술을 사용하는 것이 다른 기법을 사용하는 것보다 훨씬 낫다고 본다. 그는 이 방식으로 “인터뷰 대상자들이 자신의 이야기를 설명할 수 있고, 다른 상황에서는 불가능했을 방식으로 그들의 인간성을 회복시켜 준다”고 말한다.
[10] 얼굴과 드러나는 표정을 통해 생각과 감정을 더 잘 전달할 수 있다는 말이다. 그리고 다큐멘터리의 진실성과 관련된 문제에 대해서는 다음과 같은 의견을 밝혔다. “(딥페이크와 같은 기법이) 덜 정직하거나 윤리적이라고 말한다면, 다른 모든 다큐멘터리 제작도 마찬가지다, 이는 제작 과정에 대한 신뢰의 문제다.” 미국 샌프란시스코주립대학교(San Francisco State University) 명예교수이자 다큐멘터리 분야 선구자인 빌 니콜스(Bill Nichols)도 《뉴욕타임스》와의 인터뷰에서 〈웰컴 투 체첸〉에서는 “얼굴을 통해 영혼이 드러나는 것을 볼 수 있다”며 딥페이크가 복잡한 정서적 애착을 허용하면서도 인터뷰 대상자의 정체성을 숨기는 새로운 ‘부드러운 가면(soft mask)’이 될 수 있다고 말했다.
[11]
이처럼 딥페이크가 영상 제작 과정에 매우 다양한 목적으로 활용될 수 있다 보니, 이에 대한 업계의 관심도 지속적으로 높아지는 상태다. 이를 잘 보여 주는 것이 앞서 언급했던 브루스 윌리스의 메가폰 광고와 관련된 해프닝이다. 그는 2022년 3월에 실어증과 대본을 제대로 외울 수 없을 정도의 인지 문제로 은퇴한다고 발표했는데, 약 6개월 후 영국 언론 《데일리메일(Daily Mail)》, 《텔레그래프(The Telegragh)》 등에 윌리스가 딥케이크에 그의 얼굴 데이터에 대한 이용 권리를 판매했다는 뉴스가 실렸다. 보도대로라면 딥페이크 기술을 바탕으로 건강 상태와는 상관없이 계속 연기 활동을 하는 초특급 액션 배우가 등장한 것이니 할리우드 영화계는 순식간에 달아올랐다. 하지만 윌리스의 대변인은 곧장 “브루스 윌리스는 초상권이나 얼굴 데이터와 관련해 딥케이크와 어떤 합의도 한 적이 없다”고 밝혔다. 딥케이크 역시 “메가폰 광고 제작 당시 딥케이크는 메가폰과 브루스 윌리스 간의 계약에 대한 제3자로서 얼굴 데이터 제작만 담당했을 뿐, 그의 얼굴 데이터 계약과 관련해 아는 바가 없다”고 발표하면서,
[12] 잠깐이나마 딥페이크 커뮤니티와 영화업계를 떠들썩하게 만들었던 사건은 마무리됐다.
브루스 윌리스의 사례는 비록 뜬소문이었지만 많은 영상 엔터테인먼트 기업들이 딥페이크 기술이나 인력을 보강했다는 ‘진짜’ 소식이 심심치 않게 들려온다. 예를 들어 디즈니는 산하 스튜디오(Disney Research Studio)를 통해 직접 딥페이크 기술을 지속적으로 개발·개선하고 있다.
[13] 루카스필름의 특수효과 전문 기업 ILM은 뒤에서 언급할, 수준급의 딥페이크 영상을 전문적으로 업로드하던 유튜버 ‘샴묵(Shamook)’을 직접 고용하기도 했다.
진짜 얼굴 vs. 가상의 얼굴
이쯤에서 궁금한 점이 생긴다. 유명 배우의 얼굴 데이터만 사용할 수 있다면 배우의 나이에도, 건강에도, 구애받을 필요가 없다. 그렇다면 모든 영상을 딥페이크로 대체하는 게 낫지 않을까? 제작사 입장에서는 직접 배우를 기용하지 않아도 되기에 출연료를 훨씬 줄일 수 있다. 또한 관객들이 원하는 배우의 나이대를 선택해 출연시킬 수도 있고, 심지어는 죽은 배우도 언제든지 스크린에 불러올 수 있다. 배우의 입장에서도 촬영에 따르는 이런저런 불편함과 위험을 겪을 필요가 없거니와, 직접 출연할 때보다 더 많은 작품에 출연할 수 있게 된다. 부족한 능력을 대역이 보완해 줄 수도 있을 것이다. 이렇게 장점이 많은데 대체 왜 딥페이크 기술이 모든 영상을 장악하지 못하는 것일까?
첫 번째 이유는 딥페이크 기술의 효율성이 그렇게까지 높지 않기 때문이다. 디지털 영상을 제작하는 과정에는 영상에 대한 데이터를 우리가 실제로 볼 수 있는 영상으로 만들어 내는 렌더링(rendering) 작업이 필요한데, 이 렌더링 작업에 어마어마한 컴퓨팅 파워와 시간이 소요된다. 일례로 1993년에 공개된 영화 〈쥬라기 공원 〉의 경우 공룡의 3D 모델을 렌더링하는 작업에 하나의 프레임당 네 시간 이상이 걸렸고, 특히 비를 맞고 있는 티라노사우르스의 장면은 한 프레임을 렌더링하는데 여섯 시간이 소요됐다.
[14] 영화는 초당 24프레임으로 제작되는데, 영화나 드라마, 시리즈물 같은 장편 영상을 모두 대역을 통해 촬영하고, 대역의 얼굴을 프레임별로 일일이 딥페이크로 수정한 다음에 이 영상을 다시 몽땅 렌더링하는 것이 과연 처음부터 비싼 돈을 주고 유명 배우가 직접 촬영하도록 하는 것보다 나은 일일까?
두 번째 이유는 딥페이크를 통해 고화질 영상을 제작하기에 (최소한 현재는) 어느 정도 기술적 한계가 있기 때문이다. 딥페이크 기술은 개발 과정에서 화질을 높이는 것보다 얼굴 특징을 자연스럽게 바꾸는 것에 초점을 맞추는 경향이 높았기 때문에 최종적으로 산출된 영상의 화질이 원본보다 열화되는 경우가 많다. 애초부터 고화질 TV나 영화관 같은 대형 스크린을 상정하고 개발된 기술이 아니라는 뜻이다. 2020년 디즈니 리서치 스튜디오가 처음으로 1024x1024의 메가픽셀 해상도로 딥페이크 영상을 제작할 수 있는 기술을 개발했지만, 최근 4K 가정용 TV와 모니터가 보편화하고 있고, 8K 영화도 등장하고 있다는 것을 생각하면 아직 FHD(1920x1080) 해상도도 지원하기 버거워하는 딥페이크 기술을 영상 업계가 전면적으로 적용할 수는 없는 노릇이다.
마지막 이유는 가상 배우(Virtual Actor) 기술의 발전이다. 대역조차 없이 처음부터 배역에 맞는 완벽한 외모를 갖고 감독의 의도와 한 치의 오차도 없이 움직이는 배우를 만들어 기용하는 기술이 이미 상당히 개발돼 있다. 최근 인기가 높은 슈퍼 히어로 영화들에서 우리가 보는 인물들, 캐릭터의 상당수는 인간 배우에 전혀 기대지 않은 데이터들이다. 실제 사람처럼 움직이고 말하는 캐릭터를 처음부터 만들 수 있는데 굳이 얼굴을 바꾸는 작업을 해야 할까?
이러한 한계 때문에 딥페이크 기술의 활용은 아마추어 영상 제작자들이 활동하는 커뮤니티에서 훨씬 더 활성화돼 있다. 딥페이크를 이용해 영상 속의 얼굴을 바꿔치기하는 건 이미 유튜브와 같은 동영상 플랫폼에서는 잘 알려진 ‘놀이’로 자리 잡았다. 사실, 딥페이크 기반의 포르노 영상들만큼 이 기술을 대중에게 알리는 데 혁혁한 공을 세운 것이 바로 서로 관련은 있지만 완전히 다른 유명인의 얼굴을 서로 바꿔치기한 딥페이크 영상들이다. 영화 〈람보 (Rambo)〉의 주연인 실베스터 스탤론(Sylvester Stallone)의 얼굴을 그와 여러모로 비견되는 배우 아놀드 슈워제네거(Arnold Schwarzenegger)의 얼굴로 바꾼다든가, 반대로 영화 〈코만도(Commando)〉에 출연한 슈워제네거의 얼굴을 스탤론의 얼굴로 바꾼 것들이 이런 사례에 속한다. 물론 딥페이크 기술이 등장하기 전에도 이와 비슷한 놀이는 있었다. 하지만 2000년대 말 이전까지 이런 놀이는 대부분 스틸 이미지를 기반으로 이뤄졌다. 하지만 딥페이크 기술이 알려지면서 이 놀이의 영역이 동영상으로까지 넓어졌다. 이 놀이에서 ‘사람들이 얼굴이 바뀌었다는 것을 모르게’ 하는 것이나 ‘최대한 자연스럽게 튀지 않도록’ 얼굴을 바꾸는 것은 중요하지 않다. 의외의 몸에 의외의 얼굴을 붙임으로써 어색함, 코믹함을 드러내는 것이 목적이기 때문이다. 영상의 질이 높지 않아도 되기 때문에 이 기술에 흥미를 가진 사람들은 너도나도 이런 종류의 영상을 만들어 유튜브에 업로드했고, 결과물이 트위터, 페이스북 등을 통해 확산하면서 딥페이크 자체의 인지도도 높아졌다.