특이점의 예술
3화

인간의 한계 너머

데이터로 세계를 이해하다


앨런 튜링은 인간을 속일 줄 아는 기계에게는 생각하는 능력이 있는 것으로 간주했다. 튜링의 신념을 이어받아 1991년부터 지금까지 열리는 챗봇(chat-bot) 경진 대회가 있다. 이 대회에서 인간을 속이는 챗봇, 즉 가장 인간다운 챗봇에게는 뢰브너 상(Loebner Pize)이 수여된다. 2013년, 2015년, 2016년, 2017년 연속으로 이 상을 수상한 미쓰쿠(Mitsuku)라는 챗봇과 대화를 해보았다.[1] 처음 채팅을 시작할 때, 이름과 사는 곳을 말하고 한참 다른 이야기를 한 뒤, 다시 물었다. “너 내 이름 기억하니?” 돌아온 대답은 “내가 기억력이 나빠도 네 이름은 기억하지”였다. 그리고는 내 이름을 불러 줬다. 미쓰쿠는 상대의 이름, 사는 곳을 기억하고 질문을 던진다. 반박하기도 하고, 자기주장도 한다. 살아 있다는 것의 의미나, 기계와 인간의 차이 등 꽤 심오하고 철학적인 주제의 대화도 주도적으로 이끌었다.

튜링은 기계의 대답이 인간을 속일 수 있을 정도라면 과연 그 대답이 인공 신호에 의해 억지로 끼워 맞춰진 것이라고만 할 수 있는지 의문을 제기했다. 이미 1950년대에 말이다. 그는 이해한다는 추상적 개념을 기계에 대입할 수 있는 수준으로 정의하고자 했던 최초의 학자다. 여기서 튜링이 말하는 이해는 일반적인 의미 이해가 아니라 의미 해독 능력(literacy)에 가깝다. 전자가 추상적 개념인 데 비해, 후자는 충분한 자료를 종합하고 가공할 수 있는 능력을 의미한다. 사실 의미나 의식 같은 개념은 완벽하게 정의 내리기 어렵다. 튜링은 개념을 직접 정의하는 것이 아니라, 그것을 판단할 수 있는 보편적인 방법을 제시해야 한다고 봤다.

미쓰쿠나 구글 어시스턴트, 시리(Siri) 같은 챗봇과의 대화에서 발견할 수 있는 원리는 여러 대화 상황이 있는 데이터베이스에서 알맞은 답변을 자동으로 제공하는 구조다. 자동화는 인공지능의 중요한 특징이자 뉴미디어의 주요 원리다. 철학자 레프 마노비치(Lev Manovich)는 뉴미디어의 특징을 낮은 단계의 자동화와 높은 단계의 자동화로 구분하여 설명했다. 낮은 단계의 자동화는 일상에서 쉽게 접할 수 있는 것이다. 예를 들면 컴퓨터의 간단한 프로그램을 이용해 글이나 이미지를 수정하거나 새로 만들어 내는 것이다. 포토샵에서 이미지의 채도를, 워드 프로세서에서 오타를 자동으로 수정해 주는 것이 여기에 해당된다. 웹 사이트에서 무언가를 검색했을 때, 즉시 해당 페이지를 보여 주는 것도 낮은 단계의 자동화다.

높은 단계의 자동화도 있다. 만들어지고 있는 객체에 포함되는 의미를 컴퓨터가 이해하는 것이다. 마노비치는 2000년대 초 이뤄지던 높은 단계의 자동화 연구에 대해 부분적인 성공만 이룬 수준이라고 일축했으며, 나아가 높은 단계의 자동화가 가능해지면, 창작 과정에서 인간의 의도가 사라질 수 있다고 보았다.[2]

인공지능 번역은 문자 그대로의 의미를 이해하는 자동화의 대표적인 예다. 구글 번역은 신경망 기계 번역 시스템을 사용한다. 예전에는 문장을 구(phrase)로 나누고, 그 구를 개별적으로 번역한 뒤 합치는 방식이었다면, 새로운 신경망 시스템은 문장 전체를 한 번에 번역한다. 인공지능 번역은 기존보다 오류를 평균 60퍼센트 정도 줄였을 뿐만 아니라, 사용자가 더 많이 사용할수록, 즉 데이터가 더 많아질수록 더 정확한 번역을 제공한다. 유행어나 은어를 번역할 수 있는 것도 이 시스템 덕이다.

그러나 우리가 주목해야 할 것은 향상된 번역의 수준이 아니라, 신경망 번역 시스템 내부에 만들어지고 있는 자체 언어(interlingua)다.[3] 구글의 개발진은 이를 제로 샷(Zero Shot) 번역이라고 정의했다. 예를 들면 한국어-영어를 번역할 수 있는 데이터와 영어-일본어를 번역할 수 있는 데이터가 있다면, 한국어-일본어 번역은 별도의 데이터 주입이 없어도 가능하다. 인공 신경망 내부의 형상을 보면 같은 뜻을 가진 문장이 같은 색으로 표시된다는 것을 알 수 있다. 이것은 인공지능이 단순히 문자 대 문자의 번역을 기억하는 것이 아니라 문장의 의미론(semantics)으로 접근하고 있다는 것을 보여 준다. 인공지능이 언어를 구성하는 자체적인 능력을 가진 것이다.

자체적인 판단 능력을 지닌 인공지능으로 구글의 에이아이 익스페리먼츠(AI Experiments)에서 제공하는 퀵 드로우(Quick Draw)라는 게임이 있다. 사용자는 단어 하나를 제공받는다. 그 단어를 보고 그림을 그리면 인공지능은 사용자가 받은 단어가 무엇인지 맞춘다. 당신에게 주어진 단어가 모나리자Mona Lisa라고 가정해 보자. 네모 액자를 먼저 그리고, 그 안에 머리가 긴 사람을 그릴 예정이었다면 퀵 드로우는 당신이 그림을 완성하기도 전에 “네가 그리는 게 모나리자 맞지?”라고 되물었을 것이다. 퀵 드로우가 이렇게 빨리 맞힐 수 있는 이유는 많은 사용자가 서로 다르게 모나리자를 그리는 동시에 대체로 같은 특징을 그리기 때문이다.[4] 퀵 드로우의 인공지능이 모나리자라는 개념을 이해한 결과라고 할 수 있다.

다음의 두 인공지능 프로그램은 전문적인 창작 영역에서 자동화의 가능성을 시사한다. 픽스투픽스(Pix2Pix)는 사용자가 입력한 스케치의 예상 완성 이미지를 보여 주는 프로그램이다. 건축물 디자인에 이 프로그램을 이용하면, 창문, 기둥, 발코니 등의 위치만 정해도 바로 완성된 결과물을 확인할 수 있다. 같은 맥락에서 페인트체이너(PaintsChainer)는 합성곱 신경망을 이용해 스케치의 형태를 인식하고 그에 어울리는 색을 자동으로 채색하는 프로그램이다. 페인트체이너의 채색은 기존의 컴퓨터가 했던 자동 채색과 달리 형태를 이해한다. 예를 들면 옷을 입은 부분과 피부를 구분해 채색하고, 신체 굴곡에 따른 명암까지 표현한다. 이러한 인공지능은 아직 초보적인 단계이긴 하지만, 몇 년 안에 상용화되어 포토샵 같은 이미지 편집 프로그램처럼 흔히 쓰일 것이다. 이처럼 상황을 이해하는 높은 단계의 자동화는 창작을 쉽고 빠르게 할 수 있도록 도와준다.

창작의 과정이 자동화되면서 떠오르는 문제는 누가 창작의 주체냐는 것이다. 앞서 마노비치는 자동화로 인간의 의도가 없어질 수 있다고 보았다. 하지만 이와 비슷한 문제는 과거에도 제기됐다. 초기 사진술을 뜻하는 헬리오그래피(heliography)를 글자 그대로 해석하면 빛이 그려 낸 이미지다. 인간의 손을 거치지 않았다는 의미다. 사진이 처음 발명되었을 때, 사람들은 필름에 이미지를 찍어 내는 역할을 빛, 즉 자연이 한다고 생각했다.

사진이 등장하고 나서 손으로 일일이 인화를 해야 했던 노동은 사라졌다. 하지만 사라진 것만 있는 것은 아니다. 창작자가 구도나 상황을 선택할 수 있는 시간과 기회는 늘었다. 사진의 등장 이후, 예술가는 새로운 표현 방법을 고민했고, 그 결과로 인상주의 그림처럼 단순 재현에서 벗어난 그림이 등장했다.

《워싱턴 포스트》의 자체 인공지능 헬리오그래프(Heliograf)는 2016년 850건의 기사를 자동으로 발행했다. 그중에는 50만 건 이상의 클릭 수를 기록한 기사도 있었다.[5] 인공지능 알고리즘이 기사를 작성하는 것은 헬리오그래피에서 빛이 이미지를 그려 내는 것과 같은 맥락이다. 헬리오그래프는 정확한 정보를 토대로 간단한 내용을 구상하는 것에 그치기 때문에 인간 기자는 인공지능의 기사를 토대로 분석을 더해 기사 작성을 마무리한다. 인공지능은 인간 기자의 일을 뺏은 것이 아니라 다른 가능성을 열어 줬다.

마찬가지로 이전보다 높은 단계의 자동화가 이뤄졌다고 해서 당장 인공지능이 예술의 주체가 될 수 있는지 결론 내리기는 어려운 상황이다. 하지만 자동화된 인공지능이 인간 창작자의 창의성을 확장하고 작업의 효율을 돕는 것은 사실이다.

헬리오그래프처럼 인공지능과 인간 창작자가 함께 새로운 창작물을 선보이는 사례는 종종 찾아볼 수 있다. 예컨대 쥬크덱(Jukedeck)은 저작권 문제가 없는 곡을 자동 작곡하는 인공지능이다. 사용자는 음악의 장르, 분위기, 길이, 빠르기, 악기를 선택할 수 있고 설정에 맞게 인공지능이 작곡한 음악을 바로 다운받을 수 있다. 쥬크덱은 작곡 엔진과 프로덕션 엔진으로 구동된다. 먼저 딥러닝을 통해서 많은 데이터를 학습한 작곡 엔진이 악보를 완성한다. 이후 프로덕션 엔진에서 악기나 소리의 주파수 영역 등을 선택한다. 이때 걸리는 시간이 작곡 엔진에서 2초, 프로덕션 엔진에서 38초다. 1분이 채 안 되는 시간이면 곡 하나를 작곡할 수 있다. 쥬크덱의 공동 창업자 패트릭 스툽스(Patrick Stoobs)는 과거 인공지능 음악은 단조로운 전자 음악에 불과했지만, 현재는 사람이 작곡한 곡과 구별하기 어려운 수준에 이르렀다고 자신했다. 그리고 2018년, 쥬크덱과 한국 음반 제작사가 함께 세계 최초의 인공지능 음반 레이블 A.I.M을 설립했다. 인공지능과 인간이 함께하는 창작은 매우 가까이 와 있다. 창작의 가능성은 인간의 역량을 넘어서는 영역까지 확대될 것이다.

1세대 컴퓨터 예술가 가와노 히로시(川野洋)는 기계 예술의 존재 이유에 대해 이렇게 말했다. “인간 예술은 인간 두뇌의 한계에 갇혀 낡은 것만 만들어 내는 경향이 있다. 인간의 손과 머리를 사용하지 않고 컴퓨터에 맡겨도 되는 영역이 있지 않을까 하는 생각이다. 가령 인간이 하려면 오랜 시간이 걸리는 일도 컴퓨터는 몇 분 만에 할 수 있지 않은가?”[6]

그의 말처럼 인간의 영역 너머에서 제작을 가능하게 하는 것이 인공지능 창작의 존재 이유다. 오늘날 인공지능은 손쉬운 창작의 도구를 넘어서 적극적으로 창작에 개입하고 인간을 돕는 동료로 발전하고 있다. 창작의 주체성이 인공지능에게 완전히 넘어가는 일은 아직 요원하지만, 높은 단계의 자동화로 향하는 과정은 인간의 한계를 뛰어넘은 예술로 가는 길의 핵심이다.

 

렘브란트의 부활


렘브란트 사후 347년이 지난 2016년, 렘브란트가 부활했다. 그를 부활시킨 건 마이크로소프트와 네덜란드 델프트(Delft) 대학, 렘브란트 미술관이 함께 진행한 인공지능 프로젝트, 넥스트 렘브란트(The Next Rembrandt)였다. 넥스트 렘브란트는 얼굴 인식 알고리즘으로 렘브란트 회화에 등장하는 사람들의 얼굴 패턴을 읽어 낸다. 눈, 코, 입의 간격이나 눈동자 표현 등 얼굴 묘사 특징을 계산해서 새로운 그림의 정확한 프레임 안에 배치한다. 3D 프린팅 기술을 통해 회화 질감까지 완벽하게 재현한다.
넥스트 렘브란트 프로젝트 결과물
분명 넥스트 렘브란트의 그림은 렘브란트 그림의 모사품이 아니다. 그러나 눈을 그리는 방법, 선호하는 색상, 물감 두께 등 렘브란트의 모든 스타일을 담고 있다. 이렇게 한 미디어(렘브란트)가 다른 미디어(인공지능)에서 나타나는 것을 재매개라고 한다.[7] 재매개는 철학자 제이 데이비드 볼터(Jay David Bolter)와 리처드 그루신(Richard Grusin)이 제시한 개념으로 뉴미디어를 이전 미디어와의 상호 관계 속에서 분석한 것이다.

볼터와 그루신은 매체의 변화도 재매개로 보았다. 자료에 접근하는 수단이 변하면 그로 인한 경험 또한 달라진다. 예를 들면 렘브란트를 구글에 검색해서 나오는 고화질 jpg 파일이 실제 그림과 똑같다고 해도 그 그림을 보는 우리의 경험은 미술관에서 실제 그림을 관람하는 것과 다르다. 해당 파일이 암스테르담 국립박물관에 있는 실제 렘브란트의 그림의 재매개인 것이다.

그러나 인공지능 창작에서 발견되는 재매개는 과거의 예술 작품과 형태적 유사성만 가지는 것은 아니다. 넥스트 렘브란트의 작품은 실제 렘브란트의 작품과 차이를 느끼기 힘들 정도로 비슷해 보이지만, 명백히 새로운 창작물이다. 인공지능의 재매개와 기존의 재매개 간 차이는 바로 여기서 발생한다. 인공지능은 작품 자체가 아닌, 창작 과정 그리고 창작 주체인 인간을 재매개한다.

인공지능이 인간의 창작 과정을 재매개할 수 있는 이유는 창작 알고리즘 때문이다. 예컨대 원근법은 시각을 자동화하기 위한 알고리즘이었다. 원근법을 이용하여 2차원의 회화 안에 3차원의 대상을 담을 수 있었다. 컴퓨터가 등장하면서 원근법은 컴퓨터 그래픽과 컴퓨터 비전의 토대가 되었다. 컴퓨터 비전은 인간의 시각을 알고리즘이라는 형태로 분석함으로써 인간의 시각을 재매개한다.

창작 과정에서 인간은 감각 기관으로 데이터를 받아들인 후, 뇌에서 분석한다. 그리고 일반적으로 손이라는 출력 시스템을 거쳐 작품을 완성한다. 창작을 위해서는 반드시 인풋(input) 데이터가 있어야 하고, 뇌 속의 창작 알고리즘을 거쳐 아웃풋(output), 작품이 탄생한다. 이것이 일반적인 창작 과정이긴 하지만 우리는 뇌 속의 분석 시스템과 생성 시스템 속에 어떤 알고리즘이 있는지는 설명하지 못한다.

최근의 인공지능 연구는 인간의 창작 알고리즘을 밝히기 위해 노력하고 있다. 임의의 이미지 속에서 양식(style)과 내용(contents)을 분리해 예술적 이미지를 만들어 내는 방법을 다룬 연구가 있다. 인공지능은 알고리즘을 이용해 터너, 반 고흐, 뭉크, 피카소, 칸딘스키의 그림에서 패턴을 분석해 새로운 사진에 적용한다. 처음 패턴을 분석하고 분리하는 단계에 해당하는 것을 분석 시스템, 그렇게 분리된 양식을 결합해 새로운 이미지를 만드는 생성 시스템으로 작동하는 원리다. 본래 한 작가의 양식은 다른 사람이 모방할 수 없는 고유한 것이었다. 그리고 작가 역시 자신의 양식이 어떻게 형성되는지 설명할 수 없었다. 그러나 인공지능은 작가의 그림을 픽셀 단위로 분석해 예술 작품이 어떤 방식으로 완성되는지 그 과정을 밝히고 재매개한다. 이 연구에서 중요한 점은 인공지능이 다양한 명화를 따라 그렸다는 것이 아니라 “인간이 어떻게 예술적 이미지를 생성하고 인식하는지 알고리즘으로 이해하는 길을 제시”했다는 것이다.[8]

인공지능의 재매개는 다양한 예술 분야에서 나타나고 있다. 작가, 예술가, 개발자가 모여 만든 보트닉 스튜디오(Botnik Studio)는 50개 팀이 넘는 가수의 노래 가사, 텔레비전 쇼, 비디오 게임의 텍스트에 기반을 두는 인공지능 어플리케이션 프리딕티브 라이터(Predictive Writer)를 제공하고 있다.[9] 글 속에서 패턴을 찾아 그다음 단어를 제시하는 인공지능 알고리즘도 있다. 세계 최초로 단편 영화를 만든 인공지능 벤자민(Benjamin)은 1980~1990년대 공상 과학 영화를 학습해 이를 토대로 각본을 작성했다. 그러나 개발진은 벤자민의 각본이 독창적일 게 없으며, 인간 각본의 평균 수준이라고 평가했다. 그러나 벤자민은 영화의 패턴을 드러낸다. 우리가 어떤 장면에서 감동을 받고 눈물을 흘리는지, 다시 말해 우리가 어떻게 그런 감정을 학습했는지 말이다. 벤자민은 다양한 문화를 수용하고 반영해 인간의 특성을 비추는 거울이라고 할 수 있다.

재매개의 어원은 치료하고 회복시켜 건강하게 하는 것이라는 뜻의 라틴어 remederi다. 재매개는 현재의 미디어가 과거의 미디어를 개혁하거나 개선한다는 의미를 내포한다. 인공지능도 인간의 창작을 보완한다. 인공지능의 창작은 많은 양의 데이터를 바탕으로, 인간이 평생에 걸쳐 연습했던 고유한 양식을 단기간에 학습하여 구현해 낸다. 또 양식을 알고리즘으로 분석한 결과를 토대로 전에 없던 새로운 창작물을 만든다. 인공지능의 창작은 기존 예술 작품에서 느낄 수 없었던 지각 경험을 이끌어 내며 인간의 창작물을 개선한다. “재매개는 예술 작품의 아우라를 파괴하는 것이 아니다. 그 대신 다른 미디어 형식 속에서 그 아우라를 개조해 낸다”는 볼터와 그루신의 말처럼[10], 인공지능은 인간의 창작을 재매개하며 새로운 의미를 만들고 있다.

 

인공지능의 의지


인간의 모든 행동에는 자유 의지가 선행된다. 하지만 인공지능이 데이터를 선택하고 조합하기 위해서는 먼저 프로그래밍이 필요하다. 무엇을 하려는 의지나 욕망을 기계에 주입하는 일은 아직 불가능하다. 인공지능의 창작 행위는 예술 의지가 아니라 설계자의 결정을 따른 것이다. 인간과 인공지능이 결코 같아질 수 없는 이유가 여기에 있다.

인간의 예술이 인공지능 창작물보다 우위에 있다는 뜻은 아니다. 인간과 인공지능의 창작에는 공통점도 있다. 미지의 영역, 불투명성이 존재한다는 사실이다. 인지 과학자이자 컴퓨터학자인 더글러스 호프스태터(Douglas Hofstadter)는 “인간 역시 자신의 심상이 어디서 오는지 정확히 알 수 없고, 선택과 조합의 무한한 가능성 앞에서 무력할 뿐”이라고 말했다.

다음은 그가 자신의 저서 《괴델, 에셔, 바흐: 영원한 황금 노끈》에서 설명한 것이다. 어떤 작가가 마음속에 떠오르는 이미지와 관념을 전하기 위해 붓을 들었다고 가정해 보자. 그러나 작가는 그 이미지와 관념이 마음속에서 어떻게 조화를 이루는지 명확히 알지는 못한다. 그래서 처음에는 이런 방식으로, 다음에는 저런 방식으로 바꾸기도 하면서 다양한 표현 방식을 실험해 본다. 그리고 최종적으로 어떤 방법을 정해 그림을 완성한다. 작가는 이 모든 것이 마음속 어디에서 왔는지 모른다. 여러 방식을 실험해 보며 그 이미지를 가장 잘 표현하는 법을 어렴풋이 알게 된 것뿐이다.

컴퓨터 프로그램도 마찬가지다. 프로그램에 주입되어 있는 정보와 그렇지 않은 정보 사이에서 결과물이 나온다. 아는 것과 모르는 것 사이의 미묘한 균형이 유지된다면 우리는 프로그램을 인간과 동등한 의미에서 작가라고 부를 수 있을 것이다.[11] 호프스태터는 자유 의지를 “자신이 어떻게 작동하는지에 대해 완전히 이해하지 못하는 일종의 직관적인 감각”으로 정의했다. 아는 것과 모르는 것 사이의 균형으로부터 자유 의지가 발생한다고 본 것이다.

창작하는 인공지능으로 주목받았던 구글 딥드림은 합성곱 신경망을 이용해 이미지의 패턴을 분석하고, 분석한 이미지에 다른 이미지를 합성해 새로운 이미지를 만들어 낸다. 사용자는 입력 데이터가 되는 사진을 딥드림에 넣지만, 결과로 나올 그림에 대해서는 구체적인 설정을 할 수 없으며 결과물이 왜 그렇게 나왔는지도 모른다. 인간과 인공지능 모두 창작을 위해 일련의 알고리즘을 따른다. 이는 알고리즘 안에는 스스로 명확히 설명할 수 없는 자유 의지가 있다는 것을 의미한다. 행위의 범주를 창작으로 좁힌다면, 자유 의지는 곧 예술 의지(kunstwollen)로 이해할 수 있다.

예술 의지를 관통하는 작동 기제는 자율성이다. 자율성은 철학자 움베르토 마투라나(Humberto Maturana)와 프란시스코 바렐라(Franisco J. Varela)가 정의한 생물의 특징에서 차용한 것이다. 이들이 언급한 자율성을 이해하기 위해서는 자율성이 발생하는 구조를 이해해야 한다. 마투라나와 바렐라는 자율성의 구조를 보여 줄 수 있는 대표적인 개체로 세포를 꼽았다. 세포는 환경과 끊임없이 상호 작용한다. 여기서 말하는 환경은 세포 발생이 일어날 수 있는 상태, 매질(medium)을 의미한다. 환경은 세포의 구조에 변화를 일으킬 뿐 결정짓거나 명령하지 않는다. 세포 역시 환경의 일부로서 환경 변화에 기여하고 있지만 결정하거나 명령한 결과는 아니다. 세포와 환경은 반복적 상호 작용으로 변화하고, 발전한다.[12] 결국 자율성은 환경과 분리되지 않은 상태에서 스스로 변화하고 생산할 때 가능하다.

일반적으로 우리가 말하는 자율성은 스스로 무언가를 선택하는 행위로, 인간만이 가능한 것이었다. 그러나 바렐라와 마투라나를 거치며 자율성이 인간에게만 주어진 의지 같은 것이 아니라 생물 그리고 비 생물도 갖고 있는 작동 기제가 될 수 있다는 주장이 주목받기 시작했다. 이제 자율성은 환경과 접속되어 있는 개체 내부에서 반복적으로 발생하는 것이다. 두 사람의 주장은 사이버네틱스에 큰 영향을 줬다. 이후 사이버네틱스를 이야기할 때는 생명체와 인공물이 함께 다뤄진다.

여기서 중요한 것이 순환성, 즉 반복이다.[13] 마투라나와 바렐라는 개체 발생을 “반복적인 질서에 끊임없이 변화하며 수행되는 창조적 진화”라고 말하며 반복을 생명의 본질로 파악했다. 반복은 인공지능 창작의 중요한 특징이자 다른 기술 매체와의 차이가 드러나는 지점이다.

과거 창작의 반복은 노동의 반복을 뜻했다. 같은 이미지를 만들기 위해서는 똑같은 행위가 반복돼야 했다. 반복이 완벽히 똑같은 창작물을 보장하지도 않았다. 19세기 초에 등장한 석판은 이미지를 반복적으로 생산할 수 있는 기계나 마찬가지였다. 석판은 신문의 삽화 같은 일상의 모습을 빠르게, 그리고 많이 그림으로 담아내며 이미지를 대중화했다. 사진의 발명은 동일성을 보장하는 무한한 반복 창작을 가능케 했다. 1950년대 컴퓨터가 창작의 과정에 들어오면서 반복적인 이미지는 더 쉽고 빠르게 제작될 수 있었다. 초기 컴퓨터 예술은 컴퓨터의 기술적 능력을 드러내기 위해 일부러 반복적인 선이나 도형을 주로 사용했다. 그동안의 반복에는 어떠한 차이도 발생하지 않았다. 그리고 그것은 바람직한 현상이었다. 사진을 인화할 때마다 결과물이 매번 달라진다면 필름이 수명을 다한 것이고, 컴퓨터에서 복사한 것과 붙여 넣은 내용이 다르면 컴퓨터가 제대로 작동하지 않는 것이다.

그러나 인공지능의 반복은 다르다. 반복을 통해 학습하고 최상의 결과를 찾아낸다. 알파고를 개발한 구글 딥마인드는 딥러닝과 강화 학습을 결합한 방법으로 인공지능의 게임 플레이가 어떻게 발전하는지 보여 주는 연구를 발표했다.[14] 인공지능은 아무런 규칙 없이 벽돌 깨기 게임을 시작한다. 처음 몇 번은 계속 공을 놓친다. 100회 반복했을 때는 단순히 공을 놓치지 않기 위해 노력하는 모습을 확인할 수 있다. 학습을 반복할수록 공이 오는 지점을 예상해 공을 놓치지 않는다. 그리고 마침내 600회를 반복하면, 가장 빠르게 점수를 얻는 방법을 깨우친다. 바로 한쪽 벽에 구멍을 만들고 그 사이로 공을 넣어 벽돌을 단번에 없애는 것이다.
벽돌 깨기 게임을 하는 구글 딥마인드의 인공지능
알파고도 반복 학습을 이용하는 대표적인 사례이다. 2015년 알파고는 6~9단 바둑 기사들의 기보 16만 건에서 추출된 약 3000만 건의 착점을 학습했다. 알파고는 이렇게 문제와 답이 정해진 데이터에서 찾아낸 가중치를 임의로 수정하고 반복하는 강화 학습을 통해 승률을 높였다.[15] 알파고의 의의는 기존 기보에 없는, 즉 인간에게 없는 수를 발견했다는 데 있다. 당시 해설가들이 알파고의 실수라고 오인했던 알파고의 2국 중 37번째 수는 현재 바둑 이론에서는 금기시된 것으로 1만 분의 일의 확률로 인간 대국에서 등장했던 희귀한 수였다. 이세돌은 다큐멘터리 〈알파고(Alphago)〉에서 “알파고는 이기기 위한 확률적 계산을 하는 머신에 불과하다고 생각했었는데, 그 수를 보는 순간, 충분히 알파고도 창의적이라고 생각했다. 바둑의 아름다움을 잘 표현한 굉장히 창의적인 수였다”며 당시 상황을 회상했다. 그는 바둑에서 말하는 인간의 창의성도 결국은 어느 정도의 틀 안에 있었던 것이 아니었는지 질문하며, 인간과는 다른 차원의 창의성을 기계가 보여 줄 수 있음을 인정했다.

대부분의 현대적 인공지능은 강화 학습을 토대로 발전한다. 핵심 원리는 행위의 반복이다.[16] 물론 인공지능이 더 나은 답을 고민하고 이해하는 학습을 한 것은 아니다. 인공지능의 실력이 나아지는 원인으로 승부욕 같은 심리적 원동력이나 가치 판단은 있을 수 없다. 이기기 위한 최선의 수를 반복 속에서 찾아낸 결과다. 그렇다고 해서 창의성 자체를 인간의 것으로만 한정할 수는 없다. 같은 반복을 하더라도 인간이라면 불가능한 새로운 결과물을 인공지능이 만들고 있다는 것은 부정할 수 없기 때문이다.

인공지능 연구에서 신경망이 데이터 입력과 출력 후의 가중치를 업데이트해서 스스로 일관성 있게 변화해 나가는 학습 과정을 자기 조직화라고 한다. 현재 인공지능은 매우 초보적인 단계에서 자기 조직화를 하고 있다. 인간의 주체성이나 자아와 위상이 같다고 할 수 없다. 그러나 과거 다른 매체에서의 반복과 달리 인공지능의 반복은 자율성을 지닌다. 개체 발생을 위한 반복이다. 이는 인공지능 창작에서 자율적 생성이 가능하다는 근거가 된다. 자율적 생성의 가능성은 앞서 본 호프스태터의 질문, 언제 인공지능을 인간과 동등한 위치에서 작가라고 부를 수 있을지에 대한 답이 될 수 있다. 인공지능의 반복이 인간은 알 수 없는 블랙박스 안에서 이뤄진다고 하더라도 그 반복에서 발생한 결과물은 창의적이고 새로운 결과물이다. 이제 우리는 인공지능이 창작의 주체가 되는 미래의 예술을 상상할 수 있게 되었다.
[2]
레프 마노비치(서정신 譯), 《뉴미디어의 언어》, 생각의 나무, 2004년, 75-77쪽.
[3]
Mike Schuster, et al., 〈Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System〉, 2016.
[4]
퀵 드로우 웹 사이트에서 사용자가 그린 11만 1579개의 모나리자 그림을 볼 수 있다.
[6]
가와노 히로시(진중권 譯), 《컴퓨터 예술의 탄생: 컴퓨터의 예술적 잠재성에 대한 탐구와 도전》, 휴머니스트, 2008년, 197쪽.
[7]
재매개는 “모든 미디어의 특성, 모든 미디어의 내용은 언제나 또 하나의 미디어가 된다”는 마셜 맥루언의 말을 잇는 개념으로 현대 오락 산업에서의 단순한 재목적화보다 복잡한 차용, 즉 하나의 미디어가 그 자체로 다른 미디어 속에서 융합되거나 표상되는 것이다. 따라서 재매개 논리 안에서 모든 미디어는 독립적인 것이 아니라 계보적으로 연결된다.
제이 데이비드 볼터, 리처드 그루신(이재현 譯), 《재매개: 뉴미디어의 계보학》, 커뮤니케이션북스, 2006년, 53쪽.
[8]
Leon A. Gatys, et al., 〈A Neural Algorithm of Artistic Style〉, 2015.
[10]
제이 데이비드 볼터, 리처드 그루신(이재현 譯), 《재매개: 뉴미디어의 계보학》, 커뮤니케이션북스, 2006년, 91쪽.
[11]
더글러스 호프스태터(박여성, 안병서 譯), 《괴델, 에셔, 바흐: 영원한 황금 노끈》, 까치, 2017년, 986쪽.
[12]
움베르토 마투라나, 프란시스코 바렐라(최호영 譯), 《앎의 나무》, 갈무리, 2007년, 89-91쪽.
[13]
Humberto Maturana, Francisco Varela, 《Autopoiesis and Cognition: The Realization of the Living》, D. Reidel Publishing Company, 1980, p. 9.
[14]
Two Minute Papers, 〈Google DeepMind’s Deep Q-learning playing Atari Breakout〉.
[15]
김동근, 《바둑으로 읽는 인공지능》, 동아시아, 2016년, 100쪽.
[16]
강화 학습(reinforcement learning)은 시행착오를 통해 보상을 받아 행동 패턴을 학습하는 과정을 모델화한 머신 러닝의 종류이다. 강화 학습은 심리학의 조작적 조건화에 기반을 두고 자발적인 행동의 빈도를 증가시키는 것을 강화라고 하는 데서 유래했다.
다다 사토시(송교석 譯), 《처음 배우는 인공지능》, 한빛미디어, 2017년, 239쪽.
다음 이야기가 궁금하신가요?
프라임 멤버가 되시고 모든 콘텐츠를 무제한 이용하세요.
프라임 가입하기
추천 콘텐츠
Close