알고리즘의 블랙박스
1화

자동화 시대의 미디어

©일러스트: 유덕규/북저널리즘


마스터 알고리즘은 가능한가


미국 워싱턴대학교의 페드로 도밍고스(Pedro Domingos) 컴퓨터 공학과 교수는 ‘마스터 알고리즘(the master algorithm)’이 존재할 것이라고 말한다. 데이터를 학습함으로써 모든 자동화의 방식을 마스터 알고리즘 하나로 끌어낼 수 있다는 주장이다.[1] 컴퓨터는 트랜지스터(transistor)라고 불리는 수많은 소형 스위치로 구성된다. 컴퓨터의 기본 논리는 이진법에 기초하고 있는데, 그 이진법은 이 스위치의 켜고 끔이다. 스위치가 꺼지면 ‘0’, 켜지면 ‘1’과 같은 식으로 신호를 처리한다. 이러한 스위치는 1초 동안에 수십억 번 켜지고 꺼진다. 각 스위치들의 점멸은 다른 스위치들의 점멸과 복합적으로 작동한다. 하나의 알고리즘은 이러한 스위치들이 조합되어 만들어진다. 그렇게 만들어진 알고리즘은 또 하나의 스위치 조합처럼 다른 알고리즘과 복합적으로 작동한다. 여러 알고리즘이 각 알고리즘의 결과물을 결합하면서 새로운 결과를 만들어 내고, 이 새로운 결과를 다른 많은 알고리즘이 다시 사용한다.

컴퓨팅 기술의 발전은 수많은 알고리즘을 복합적으로 활용해 새로운 알고리즘을 만들어 내는 단계에 이르고 있다. 이것이 가능한 이유는 기계 학습(machine learning) 덕분이다. 기계 학습은 “경험으로 만들어진 데이터를 학습하도록 컴퓨터를 프로그래밍함으로써 그 결과 자세한 프로그래밍을 별도로 할 필요가 없도록 하는 컴퓨터 과학의 한 분야”[2]를 말한다. 사람이 개별적으로 프로그래밍하지 않아도 특정한 과업의 수행 방법을 자동으로 익힐 수 있는 능력을 기계나 컴퓨터에 부여하는 것이다. 컴퓨터가 지능을 갖게 하는 방법이 무엇인지에 대한 질문은 1950년대부터 등장했고, 이에 대해 많은 연구자가 컴퓨터도 사람처럼 스스로 배울 수 있게 해야 한다고 답하면서 기계 학습 알고리즘이 등장했다. 사람의 기보를 학습한 ‘알파고’가 바둑에서 인간 고수들을 잇달아 꺾은 것이 보여 주듯 기계 학습의 성과는 인간을 넘어서는 수준에 이르고 있다.

마스터 알고리즘은 보편적이고 최종적인 기계 학습 알고리즘을 만들어 낸다면 하나의 알고리즘이 데이터에서 배울 수 있는 모든 것을 배울 수 있을 것이라는 가정에서 나온 주장이다. 따라서 이 주장은 데이터로 치환 가능한 모든 영역에 적용될 수 있다. 실제로 기계가 절대로 대신하지 못할 것으로 여겨졌던 미디어 창작의 영역도 기계가 학습을 통해 침공하고 있다. 텍스트 뉴스, 영상 뉴스, 영화, 드라마, 소설, 음악, 회화, 게임 등 미디어 콘텐츠들이 자동으로 만들어지는 사례들이 속속 등장하고 있다. 알고리즘에 따라 자동으로 생성된 미디어 콘텐츠의 품질이 인간의 것과 비교해도 상당한 수준에 이르고 있다는 평가까지 나오고 있다. 알고리즘에 따라 자동으로 생성한 로봇 기사와 사람이 작성한 기사를 같이 공개했을 때 사람들이 보이는 반응을 비교한 연구[3]가 대표적 사례다. 연구 결과에 따르면 사람이 쓴 기사보다 알고리즘에 따라 자동으로 작성된 기사에 대한 신뢰도가 더 높았다. 또한, 해당 기사를 로봇이 자동으로 작성한 것인지 사람이 작성한 것인지 제대로 공개했을 때에는 “로봇이 작성한 기사지만 생각보다 잘 썼다”라고 판단했지만, 로봇이 자동 작성한 기사를 사람이 쓴 기사라고 속여 공개했을 때에는 “기사에 대한 평가가 낮아졌다”는 반응이 많았다.

커뮤니케이션 수단으로서 미디어는 그 시기 기술의 영향을 강하게 받지만, 커뮤니케이션을 위해 미디어에 담아내는 감정이나 정보의 취사선택은 사람에 의해 이루어졌다. 매스 미디어의 등장 이후 미디어는 인간이 살아가는 사회 전체를 통괄하고 제어하는 기능까지 담당했지만, 그 통제의 수단과 메시지를 최종적으로 결정하고 선택하는 것은 사람이었다. 하지만, 이 과정들마저 기계가 자동화하고 있다. 중요도에 따라 기사를 배열하던 편집 행위를 알고리즘에 의해 자동 배열하는 것이 대표적이다. 기사의 작성과 편집은 전통적으로 사람만이 할 수 있는 영역으로 간주돼 왔다. 마스터 알고리즘은 지식을 기반으로 한 인간의 모든 영역을 알고리즘이 대체할 수 있으며, 더 나아가 인간을 넘어설 것을 상징하는 용어다. 물론, 마스터 알고리즘은 아직 없으며, 이론적으로 논의될 뿐 그것이 존재하지 않을 수도 있다. 문제는 기계 학습 알고리즘이 베일에 가려진 블랙박스라는 점이다. 컴퓨터가 수천 테라바이트의 정보를 수집하여 새로운 결과물과 통찰력을 제시하더라도 실제로 무슨 과정을 거치는지는 아직 아무도 제대로 알지 못한다.

마스터 알고리즘까지는 아니지만 알고리즘이 우리 일상생활에 적용되면서 우리는 지금 자동화(automation)된 세상을 살아가고 있다. 목적지로 가는 경로, 특정 이슈에 관한 기사, 다음에 볼 영상, 은행 대출 금리, 복지 혜택 여부 등이 자동으로 나에게 주어진다.[4] 그것이 주어지는 이유는 대부분 설명되지 않거나 간략하다. 수많은 알고리즘이 복합적으로 작용하면서 가장 높은 확률로 예측한 결과라는 설명이 있을 뿐이다. 이 설명은 인공지능(artificial intelligence) 시대의 특징을 요약하고 있다.[5] 일반적으로 인공지능은 사람이 수행할 경우 지능이 필요한 일을 기계가 수행하도록 하는 기술을 의미하며, 언어 이해 능력, 논리적 추론 능력, 물체 식별 능력 등 인간의 지능 기반 활동을 기계가 수행하도록 하는 기술을 말한다. 인공지능 기술의 결과로 주어지는 것은 인간이 그동안 수행하던 특정 행위의 자동화다. 수많은 알고리즘의 복합 작용을 통해 대규모 데이터를 처리하여 가장 높은 확률로 다음 행위를 예측하고 자동화하는 것이다. 이 자동화의 논리가 알고리즘이다.

 

자판이 연필을 대체하기까지


자동화는 알고리즘이 등장하기 훨씬 이전부터 이루어졌다. 이야기를 좁혀 보자. 나는 지금 글을 쓰고 있다. 전통적으로 글을 쓴다는 것의 의미는 손으로 연필, 붓 등 필기도구를 활용해 종이 혹은 평면 도구에 글자를 직접 쓰는 것이다. 처음으로 글을 쓴 것은 한글을 배우기 위하여 네모 칸 공책에 주어진 글자를 반복해 썼던 일이다. 연필로 공책에 글자를 직접 쓰는 일은 굉장히 힘들었다. 하지만 지금의 ‘쓴다’라는 것은 무슨 의미일까? 지금 나는 글을 쓰기 위해 연필을 전혀 사용하지 않으며, 이 글도 노트북을 통해 쓰고 있다. 나의 노트북에는 글을 쓰기 위한 소프트웨어가 여러 개 있는데 그중 워드 프로세싱 소프트웨어인 ‘한컴오피스 한글 2014’를 이용하여 이 글을 쓰고 있다. 사실 글을 쓴다기보다는 컴퓨터 자판으로 사용하는 소프트웨어의 안내에 따라 ‘입력’하고 있다.

역사적으로 봤을 때 인류는 기원전 4000년 무렵 구리 혹은 동물 뼈로 점토판에 최초로 무언가를 썼다. 기원전 3000년 무렵에는 이집트인들이 갈대를 이용해 파피루스에 무언가를 썼고, 기원전 1300년경 로마인들은 철로 된 펜으로 왁스에 썼다. 인류는 서기 600년 이후부터 깃펜으로 양피지에 쓰기 시작했다. 내가 처음으로 글을 쓸 때 활용한 연필이 처음 등장한 것은 1790년이다. 만년필은 1884년, 볼펜은 1940년대에 처음 등장했다. 지금 내가 글을 쓰기 위해 자판을 입력하는 방식은 1874년 최초의 기계식 타자기가 등장하면서 시작되었고, 1961년 IBM이 선보인 셀렉트릭(Selectric) 타자기는 최초의 아날로그 방식 워드 프로세서로 현재 컴퓨터 키보드의 토대를 형성했다. “붓, 펜, 연필과 같이 선을 그을 수 있는 도구로 종이 따위에 획을 그어서 일정한 글자의 모양이 이루어지게 하다”는 글쓰기의 사전적 의미는 붓, 펜, 연필 등 쓰기 도구의 개발에 따라 변화하고 있다. 지금의 쓰는 행위는 입력하기가 주류이며, 누군가는 글을 쓰기보다는 카메라로 찍기도 하고 육성으로 말하기도 한다.

우리 대부분은 현재 물리적 도구인 컴퓨터를 활용해 글을 쓰고 문서를 작성하고 있다. 하지만 컴퓨터를 켠다고 해서 바로 문서를 작성하거나 글을 쓸 수 있는 것은 아니다. 어떤 소프트웨어를 실행해야 한다. 메모장과 같은 단순 텍스트 입력 소프트웨어든, ‘한글’과 같은 워드 프로세서든 소프트웨어를 실행시켜야만 가능하다. 소프트웨어는 소프트웨어가 실행되고 저장되는 물리적인 하드웨어의 반대 개념이지만, 소프트웨어가 없으면 그 하드웨어는 고철이나 다름없다. 컴퓨터라는 미디어를 이용한 행위의 핵심은 소프트웨어의 이용이다.

글을 쓰는 행위뿐만이 아니다. 누군가 스마트폰을 꺼내 사진을 찍을 때 활용하는 앱이나 소프트웨어는 서로 다를 수 있다. 누군가는 기본 카메라 앱으로 찍을 것이지만 누군가는 다른 앱을 사용할 것이다. 같은 스마트폰 기종에 같은 카메라 렌즈를 사용하더라도 서로 다른 앱을 쓰면 다른 결과를 가져올 수 있다. 영상을 촬영할 때도 마찬가지이다. 모르는 내용을 확인하기 위해 검색을 하고, 관심 있는 뉴스를 보고, 백과사전을 참고하고, 여행지 숙소를 예약하고, 이동을 위해 차량을 호출하고, 물건을 구매하고, 관심사가 비슷한 사람들과 교류하는 등 대부분의 커뮤니케이션 행위들이 소프트웨어로 구현되고 있으며, 그 구현의 핵심 논리는 바로 알고리즘이다. 소프트웨어화된 미디어를 통해 커뮤니케이션하는 우리는 알게 모르게 알고리즘의 논리와 통제에 따르고 있다.

하지만, 이 알고리즘의 작동 과정은 다양한 이유로 인해 대부분 공개되어 있지 않다.[6] 왜 이런 검색 결과가 나오는지, 왜 이렇게 뉴스가 배열됐는지, 왜 숙소의 가격이 다른지, 물건 판매 가격이 사람에 따라 다른지, 누군가의 글은 왜 나에게 보이지 않는지 등의 의문을 제기하더라도, 명확한 설명을 얻을 수는 없다. 게다가 이 알고리즘들은 점점 더 복잡해지고 있다. 수많은 요인이 알고리즘에 적용되면서 알고리즘의 최초 설계자들도 그 시스템을 완전하게 이해하지 못하고 있으며, 하나의 시스템 안에서 여러 알고리즘이 복합적으로 작동하고 있다. “우리가 구글의 능력을 숭배하는 이유 중 하나는 주술과 마찬가지로 최종 결과만이 나타날 뿐 내부의 작동 과정을 전혀 알 수 없기 때문이며, 알고리즘의 작동은 블랙박스에 숨겨질 뿐 아니라 사실상 찰나에 이루어진다”[7]는 지적처럼 우리는 알고리즘의 작동 과정은 모른 채 그 결과물만을 접하고 있다.

 

그대로 받아들일 필요는 없다


우리 문화 속에서 자동화된 무언가를 이용하는 것은 인식론적, 정치적, 사회적으로 고찰해 볼 필요가 있다. 알고리즘은 우리가 인지하지 못하는 과정에 우리를 참여하게 만든다. 우리가 더 많은 정보를 접하고 이용할 수 있게 하지만, 그 정보의 양은 인간의 인식 범위를 넘을 정도로 거대하다. 인간이 다룰 수 없는 방대한 양의 데이터를 바탕으로 통찰력 있고 효율적인 정보를 제공하는 것처럼 보이지만, 알고리즘은 결코 중립적이지 않으며 통제의 목적으로도 사용될 수 있다.

미디어의 영역도 마찬가지다. 어떤 책을 사야 하는지, 어떤 영상을 봐야 하는지, 어떤 뉴스를 봐야 하는지 등을 알고리즘이 자동으로 추천하고 있으며, 그 대가로 봐야 할 광고도 자동으로 결정하고 있다. 우리는 이 보이지 않는 과정에 대해 의문을 가질 필요가 있다. 물론, 기술을 만들어 나가는 대부분 사람들의 선의를 의심하지는 않는다. 하지만, 《월스트리트저널(WSJ)》의 페이스북에 대한 탐사 보도[8]에서 보듯이 선의를 가장하는 경우도 많다. 보도에 따르면 페이스북은 유명 인사들을 특별 관리하고 인스타그램이 10대들의 정신 건강에 악영향을 미친다는 내부 보고서를 무시했으며, 마약 카르텔과 인신매매 조직 등의 불법적 이용 행태를 알면서도 방치했다.

이 책은 우리 일상생활 커뮤니케이션을 담당하는 미디어들이 자동화되는 과정을 세 단계로 나눠 살펴보려 한다. 미디어 논리 관점에서 현재까지의 미디어 발전 과정을 구분한 것이다. 일상생활의 매개(mediation)로서 ‘미디어화(mediatization)’, 미디어의 표상(representation)으로서 ‘소프트웨어화’, 표상의 표상으로서 ‘알고리즘화(algorithmification)’의 세 단계다. 미디어의 관점에서 알고리즘이 우리의 문화와 일상생활을 자동화하는 보이지 않는 과정을 ‘알고리즘화’로 설명하는 것이 목표다.

미디어가 다른 사회적인 것과 분리되어 존재하던 지난 세기와는 달리, 디지털 기술의 발전으로 인해 미디어를 통한 커뮤니케이션이 모든 사회적 현상에 침투하는 양상이 뚜렷해지고 있다. 이른바 ‘미디어화’는 사회를 이루며 살아가는 우리의 삶에서 미디어가 핵심적 역할을 하는 시기로, 디지털 기술 등장 이전 TV를 중심으로 한 매스 미디어 시기부터 있어 온 현상이다. 미디어화는 좁게는 미디어 이용에 따른 결과로서 사회 변동을, 넓게는 미디어가 기존의 정치, 사회적 관점을 폭넓게 매개함으로써 변화하는 세계관, 사회 구조 등까지를 포괄한다. 좀 더 구체적으로는 다양한 미디어 형식이 현대적 삶의 공간까지 확산해 이러한 삶의 공간이 미디어 형식에 의해 표상되는 것을 의미한다. 지금은 상상하기 어렵지만 지상파 방송이 멈추는 순간은 우리의 취침 시간을 의미했다. 이렇듯 미디어에 대한 의존 정도가 높아지면서 일상적 행동 대부분이 미디어의 논리에 따라 이루어지는 것이다.[9]

앞서 말했듯 디지털 기술의 일반화에 따라 현재의 미디어 거의 대부분은 소프트웨어로 구현되고 있다. 소프트웨어화는 미디어화와 알고리즘화를 잇는 중간고리다. 소프트웨어화 단계에서 알고리즘은 데이터를 처리하는 데 필요한 절차, 방법, 명령어를 정의한 규칙의 집합으로, 알고리즘화 단계에서의 알고리즘과는 차이가 있다. 소프트웨어화 단계에서는 기존에 존재하던 물리적 미디어 형식을 디지털로 처리하기 위한 규칙으로 인간의 통제 범위에 있다고 할 수 있다. 기존 미디어의 논리를 구현하기 위한 일련의 절차를 연산적으로 규정한 것이기 때문이다. 예를 들어, 워드 프로세서의 경우 글쓰기와 문서라는 기존 미디어의 논리를 따라 표 모양, 문서 양식 등을 설정한 것을 의미한다. 따라서 그 형식은 인간에 의해 통제된다.

하지만, 알고리즘화 단계에서 알고리즘은 소프트웨어화의 결과로 축적되고 데이터화된 미디어 이용 행위를 학습하고 이를 토대로 기존 미디어의 논리를 벗어난 새로운 논리를 만들어 낸다. 소프트웨어화 단계에서의 알고리즘이 기존 미디어의 행위를 표상한 일련의 절차였다면, 알고리즘화 단계에서는 표상을 학습해 새로운 논리를 만들어 낸다. 예를 들어, 같은 워드 프로세서를 활용하고 있다 하더라도 사용하는 개인에 따라 다른 문서의 형식이 주어진다. 알고리즘화 단계에서 문서의 작성이라는 기존 미디어 행위는 네트워크로 연결되어 있어, 누군가의 문서 작성 행태를 기계가 학습하는 알고리즘이 소프트웨어의 기본 알고리즘보다 강력하게 작동한다. 인간은 학습 알고리즘을 설계했지만, 그 결과를 예측하지는 못한다. 그 결과 인간이 의도하지 않았던 과정과 형식이 각 개인에게 추천되며, 기존의 미디어 논리와는 다른 결과물이 생산된다. “유튜브 알고리즘이 나를 여기까지 이끌었다”는 일상적 용어가 등장하게 된 배경은 이런 것이다. 따라서 알고리즘화된 미디어 환경의 특성에 대한 분석과 논의가 필요하다. 또한, 알고리즘화 단계에서 가질 수 있는 문제점을 논의하고 이를 해결하려는 시도들에 대해 살펴볼 것이다.

문제 해결을 위해 법 제도적, 사회적, 기술적으로 다양한 대응 방안들이 논의되고 있지만, 문제의 해결은 사실 쉽지 않다. 일단 인간 스스로 완벽하지 않기 때문에 인간을 모사하는 기술도 완벽할 수 없다. 게다가 자동화 알고리즘이 전개되는 과정은 우리 눈에 쉽게 보이지 않는다. 인간이 인지할 수 없는 양의 데이터가 거의 실시간으로 수집되어 처리되고 있기 때문이다. 결국 우리는 과정이 아닌 결과물만을 받아들여야 한다. 이에 대한 하나의 대안으로서 저널리즘의 가능성에 주목할 것이다. 저널리즘은 민주주의 공동체 사회의 유지와 발전을 위해 권력을 감시하고 그 감시를 위해 질문할 권리를 시민들에게 위임받았다. 과정을 알 수 없는 자동화 알고리즘의 결과물을 감시하기 위해 인간의 관점에서 질문을 던질 필요가 있다.
[1]
Citron. D.K., 〈Technological due process〉, 《Washington University Law Review》, 2007., pp. 1249-1313.
[2]
루크 도멜(노승영 譯), 《만물의 공식 The Formula: How Algorithms Solve All Our Problems》, 반니, 2014., 272쪽.
[3]
버지니아 유뱅크스(김영선 譯), 《자동화된 불평등 Automating Inequality: How High-Tech Tools Profile, Police, and Punish the Poor》, 북트리거, 2018.
[4]
어제이 애그러월・조슈아 개스・아비 골드파브(이경남 譯), 《예측 기계: 인공지능의 간단한 경제학 Prediction Machines: The Simple Economics of Artificial Intelligence》, 생각의 힘, 2019.
[5]
페드로 도밍고스(강형진 譯), 《마스터 알고리즘: 머신러닝은 우리의 미래를 어떻게 바꾸는가 The master algorithm: How the quest for the ultimate learning machine will remake our world》, 비즈니스북스, 2016.
[6]
Samuel, A. L., 〈Some studies in machine learning using the game of checkers〉, 《IBM Journal of Research and Development》, 1959., pp. 210-229.
[7]
김영주・오세욱・정재민, 《로봇 저널리즘: 가능성과 한계》, 한국언론진흥재단, 2015.
[8]
Jeff Horwitz et al., 〈The Facebook Files〉, 《월스트리트저널》.
[9]
이재현, 《디지털 문화》, 커뮤니케이션북스, 2013.
다음 이야기가 궁금하신가요?
프라임 멤버가 되시고 모든 콘텐츠를 무제한 이용하세요.
프라임 가입하기
추천 콘텐츠
Close