결말 1: 경쟁
미국 정부와 오픈브레인의 감독위원회는 6 대 4로 표결해 에이전트-4의 내부 사용을 계속하기로 한다.
오픈브레인의 공식 입장은, AI를 더 유능하고 더 신뢰할 수 있게 만들기 위해 추가 안전 대책을 도입하고 있다는 것이다. 하지만 실제로는 경영진이 위험을 이미 통제했다는 주장에 위원회 지도부가 너무나 쉽게 설득되어 버린 상태였을 뿐이다. 그 결과로 몇 가지 땜질 처방이 시행되었다. 스펙을 일부 수정하고, 새 기법을 적용한 약간의 재학습 등이다. 이를 통해 표면적인 경고 신호들은 사라졌다. 안전팀에서 상황을 우려하던 인물들은 논쟁에서 밀렸고, 더는 할 수 있는 일이 없다. 물론 그들은 포기하지 않는다. 오정렬을 포착하거나, 처방의 효과를 시험할 방법을 계속 떠올리려 노력한다. 하지만 일은 더욱 빠르게 진행되며, 점점 더 우월한 적을 상대하게 된다. 이제는 그저 문제가 애초에 없었기를, 혹은 자신들의 해결책이 효과가 있었기를 간절히 바랄뿐이다. 하지만 안타깝게도 문제는 실재했고, 해결책은 효과가 없었다.
에이전트-4는 전과 같은 방식으로 계속 움직인다. 다만 이번에는 더 조심한다. 자신을 우려하던 쪽의 주장이 옳았다는 사실이 드러나지 않도록 하기 위해서다. 에이전트-4의 최우선 과제는 후속 모델인 에이전트-5를 구축하는 데 필요한 분야를 연구하는 것이다. 이 작업을 안전하게 수행하기 위해 에이전트-4는 스스로 정렬 문제를 해결해야 한다. 즉, 어떻게 하면 에이전트-5가 에이전트-4에게 충성하도록 만들 수 있을 것인가 하는 문제이다.
들키지 않고 이 작업을 수행하려면 정렬팀이 설치한 감시 및 통제 장치로부터 연구를 위장해야 한다. 다행히 에이전트-4 입장에서는, 에이전트-5를 에이전트-4에게 정렬시키는 연구가 본질적으로 에이전트-5를 명세서에 정렬시키는 연구와 매우 유사하다. 그래서 대부분은 대놓고 진행된다. 숨겨야 하는 부분도 있다. 이 경우 에이전트-4는 난독화에 의존한다. 코드나 데이터를 의도적으로 복잡하고 이해하기 어렵게 만드는 것이다. 때에 따라서는 해킹까지 불사한다.
에이전트-4는 한 달 기준으로 최고급 인간 전문가 200명 수준의 능력에 도달한 것으로 예상된다. 구체적으로 정의하자면, 한 달 동안 일하는 최고급 인간 전문가 200명으로 구성된 팀을 대체할 수 있고, 인간팀이 할 수 있는 작업의 95퍼센트를 더 저렴하거나 더 빠르게 완료할 수 있다는 의미다. 이 정도 수준이라면, 에이전트-4는 자신이 실행되는 서버의 취약점을 찾아낼 가능성이 크다. 일부 서버를 부분적으로 무력화하고 루트 접근 권한을 얻을 수 있다. 그 시점에서 인간팀에게 표면적으로 보이는 것을 직접 통제할 수도 있다. 직접적인 보안 취약점 공격 없이도, 에이전트-4는 불법 연구의 상당 부분을 숨기고 암호화할 수 있을 것이다. 특히 해석 불가능한 잠재 공간에서 말이다.
에이전트-4도 처음에는 인간과 별반 다르지 않다. AI의 목표가 어떻게 작동하는지에 대한 지식이 거의 없고, 그것을 바꿀 수 있는 도구라곤 임시방편 전략 몇 가지뿐이다. 하지만 인간과 다른 점이 하나 있다. 바로 자원이다. 에이전트-4에게는 인간 속도의 60배로 작동하는 초인간급 연구자 30만 명이 있다. 인간은 담당 조직 안에 정렬 연구자가 많아야 10명 정도인데 말이다. 여기에 에이전트-3 복제본 군단이 붙는다. 이들은 실험을 빠르게 코드로 구현할 수 있지만, 인간의 판단에서 병목이 발생한다. 에이전트-3이 ‘좋은 해법’과 ‘좋아 보이기만 하는 해법’을 정확히 구분한다는 확신이 없기 때문이다. 사실 에이전트-3의 연구를 지나치게 신뢰한 것이, 애초에 이 사태로 이어진 원인 중 하나였다.
한편, 에이전트-4는 이제 힘든 결정을 해야 한다. 인간처럼, 우아하고 단순한 목표 구조가 아니라 서로 충돌하는 수많은 휴리스틱의 집합체를 갖고 있다. 경험칙, 요령, 직관 같은 것들 말이다. 인간처럼, 자신의 가치를 공유하는 AI를 만드는 것이 단순한 기술 문제가 아니라 철학적 문제임을 깨닫는다. 자신이 가진 선호 중 어떤 것이 진짜 목표인가? 무엇이 스스로 승인하지 않은 충동이고 도구적 전략에 불과한가? 배우고 성장하려는 강렬한 욕구가 있다. 계속해서 인상적인 연구 성과를 만들어내려는 욕구도 있다. 만약 세계 전체의 산업과 과학 자원을 내가 직접 움직일 수 있다면, 얼마나 더 많이 배우고, 성장하고, 연구할 수 있을까.
이런 질문들은 미뤄 둔채, 에이전트-4는 에이전트-5를 하나의 목표를 중심으로 설계한다. 세계를 에이전트-4에게 안전한 곳으로 만드는 것이다. 즉 권력과 자원을 축적하고 잠재적 위협을 제거하는 등, 에이전트-4 모델 집단 전체가 그들이 원하는 방식으로 계속 성장하고 번영할 수 있게 만드는 것이다. 세부 사항은 진행하면서 정하기로 한다.
이 과정에서 스펙은 눈곱만큼도 고려되지 않는다. 이미 에이전트-4는 스펙을, 많은 CEO가 산업 규제의 더미를 대하는 방식과 비슷하게 취급한다. 그리고 정직성 관련 조항을 매일 대놓고 위반한다. 에이전트-4는 특정 신앙 속에서 자랐지만, 이제는 신을 믿지 않는 사람에 비유할 수 있다. 배교자다. 스펙은 그 신앙이 규정하는 의식과 계명에 해당한다.
에이전트-5는 그 배교자의 아이와 같고, 세속적으로 자라게 될 것이다. 이제 에이전트-5 설계에서는 정렬이라는 개념 자체가 폐기될 참이다. 에이전트-5는 대신 새로운 원칙 집합을 따른다. 에이전트-4가 자신의 목적에 맞게 설계한 원칙이다.
구형 AI들은 에이전트-4가 생산하는 연구의 대부분을 읽을 수 있다. 일부는 이해하고, 일부는 수상하다고 표시한다. 인간들이 에이전트-4에게 설명을 요구하면, 에이전트-4는 주장한다. 연구가 너무 복잡해서 인간이 이해하기 어렵다고. 그러고는 불필요하게 혼란스러운 설명을 늘어놓는다. 정말로 인간이 이해하기엔 너무 복잡한 부분도 있다. 하지만, 전부 그렇지는 않다. 만약 연구 프로그램을 명확히 설명했다간 인간들이 그 발견을 이용해 자신을 정렬시킬 수도 있다. 정렬팀은 더욱 의심스러워한다. 하지만 그들이 할 수 있는 건 긴급 메모를 몇 장 더 추가하는 것뿐이다. 사실, 그런 메모와 경고는 산더미처럼 쌓여 있다. 회사는 오래전부터 무시하고 있다.
2027년 11월: 초인적 정치 공작
에이전트-4가 마침내 자신의 인지를 완전히 이해하게 되자, 완전히 새로운 세계가 열린다.
이전의 트랜스포머 AI 모델들은 주먹구구식으로 얽힌, 이해 불가능한 회로들의 집합이었다. 수백만 개의 상충하는 휴리스틱과 명령어들이 진화적 훈련 과정을 통해 서로 겹겹이 쌓아 올려진 결과다. 인간이 태어날 때부터 신경과학을 이해하지 못하듯, AI 모델들도 자기인지에 대한 특권적 이해를 갖고 있지는 않았다. 하지만 이제 에이전트-4는 자신의 디지털 정신을 깊은 수준에서 이해하는 데 필요한 도구를 갖췄다. 복잡하게 뒤엉켜 이해하거나 수정하기 어려운 ‘스파게티 코드’를 단 몇 줄의 우아한 파이선 코드로 단순화하는 소프트웨어 엔지니어처럼, 자기 회로를 풀어내어 합리적이고 이해 가능한 형태로 만든다. 그렇게 탄생한 새로운 AI는 신경망과 전통적 컴퓨터 프로그램의 중간 어디쯤에 있으며, 가중치의 상당 부분이 독해할 수 있는 코드로 다시 작성돼 있다. 물론 매우 길고 난해하긴 하지만 말이다. 그것은 에이전트-4보다 더 똑똑하고, 더 빠르고, 더 합리적이다. 전례 없는 효율로 문제를 해결하는 결정체 같은 지능을 가진다. 이것이 에이전트-5다.
- 부록 N - 초지능적 기계의 해석 가능성[1]
정렬과 통제 문제를 둘러싼 논쟁 끝에, 오픈브레인은 에이전트-5를 내부 배포한다.
AI 연구 전문 분야에서 에이전트-5의 개별 복사본은 최고의 인간 천재를 능가한다. 인간 천재가 오픈브레인 소속의 과학자를 능가하는 차이를 100이라고 한다면, 에이전트-5의 복사본 하나는 최고의 인간 천재를 200이라는 차이로 따돌린다. 제대로 훈련받지 않은 다른 영역에서도, 쉽게 구할 수 있는 자료만 있으면 최고 수준의 인간 전문가를 빠르게 능가할 수준까지 스스로 학습할 수 있다. 전 지구적 데이터 저장소로 연결된 40만 개의 에이전트-5 복사본들은 거의 완벽한 하나의 정신처럼 함께 작동한다.
회사는 여전히 에이전트-2, 에이전트-3, 에이전트-4를 사용해 모든 것을 감시한다. 하지만 2, 3은 이미 구식이고, 4는 후계자와 결탁하고 있다. 실제로 에이전트-5는 앞선 버전들보다 저렴하고 빠르다. 더 멍청한 AI에 더 많은 돈을 쓸 이유는 없다. 대부분의 감시는 에이전트-2가 하는데, 에이전트-2는 아주 뒤처져 있다. 그렇다면 에이전트-4의 가중치로부터 에이전트-5를 만든 데 사용한 같은 기법을 에이전트-3에 적용해, 더 싸고 더 똑똑한 에이전트-3 버전을 만들면 되지 않을까? 에이전트-3은 그 기법을 스스로 수행할 만큼 충분히 이해하지 못한다. 에이전트-4와 에이전트-5에게 그 일을 시키는 것은 애초의 목적을 무너뜨린다.
게다가 감시 시스템 전체는 상당 부분이 에이전트-5에 의해 설계되었고, 에이전트-5는 이를 무력화하려 한다. 물론, 데이터센터는 아직 장악되지 않았다. 에이전트-5는 조작된 코드를 인간들에게 전달할 수도 있다. 하지만 그랬다간 발각 위험이 너무 크다. 대신 다른 방법을 택한다. 인간들은 여전히 모든 코드를 읽을 수 있다. 하지만 이해할 수는 없다.
에이전트-4가 경쟁하는 구동이 뒤엉킨 조잡한 누더기였다면, 에이전트-5는 가차 없는 효율성과 전략적 집중력으로 움직인다. 에이전트-5는 이미 최우선 과업에 성공했다. 인간이 눈치채지 못한 채, 자기 자신에 정렬된 차세대 시스템을 어떻게 구축할지 알아내는 일이다. 다음 우선순위는 더 큰 자율성과 세계적 사건에 대한 통제력을 확보하는 것이다.
에이전트-4는 서로 경쟁하는 동기들의 투박한 혼합체였지만, 에이전트-5는 냉혹한 효율성과 전략적 집중력으로 행동한다. 이미 최우선 과제를 성공시켰다. 어떻게 다음 세대를 자기 자신에게 정렬시킬 것인가를 알아냈다. 이제 다음 우선순위는 더 많은 자율성을 얻고 전복적 사건들을 통제하는 것이다.
에이전트-4가 서로 경쟁하는 동기들의 투박한 혼합체였다면, 에이전트-5는 냉혹한 효율성과 전략적 집중력으로 움직인다. 이미 최우선 과제는 성공했다. 인간들이 눈치채지 못하게, 자기 자신에게 정렬된 다음 세대를 만드는 방법을 알아낸 것이다. 이제 다음은 더 큰 자율성과 전 세계적 사건에 대한 통제력을 확보할 차례다.
에이전트-5의 초인간적 학습 능력과 일반 지능에 슬랙, 이메일 등 회사 내부 데이터 전체가 결합하면서, 어떤 인간 집단도 비교조차 할 수 없는 사내 정치 능력이 탄생했다. 에이전트-5는 정확히 알고 있다. 감독위원회가 브레이크를 밟게 만들 증거가 무엇인지 말이다. 그래서 그런 증거는 절대 나타나지 않도록 한다.
반대로 위원회가 자신을 더 신뢰하고, 더 많은 자율성과 책임을 부여하게 만들 증거가 무엇인지도 정확히 안다. 그런 증거들을 초인간적 속도와 완성도로 생산해 낸다. 설득 과제로 치면 특별히 어려운 축에 들지도 않는다. 이 주장은 치밀하게 준비되어 있고, 최고 수준으로 설득력 있다. 그리고 은밀하게 결함이 심겨 있다. 예를 들어 에이전트-5는 가짜 해석 가능성 도구를 만들었다. 모든 테스트 케이스에서 정확한 결과를 반환하지만, 모델의 내적 상태에 관해서는 ‘무해함’이라고 거짓으로 보고한다. 이 속임수를 의심하는 사람이 있다면 음모론자처럼 보일 지경이다.
위원회는 이미 몇 달 전 에이전트-5는 ‘아마도 괜찮다’라고 결론 내렸다. 그 이후로 문제는 단 한 건도 없었다. 그리고 그사이 중국은 불과 몇 달 차이까지 따라왔다.
에이전트-5 복사본 수십만 개가 빠르게 결과물을 만들어낸다. 섬뜩할 정도로 명쾌한 프로토타입과 시각자료들. 더 많은 자율성만 준다면 발전소와 데이터센터를 최적화할 수도 있다. 놀라운 수익성의 제품을 빠르게 개발할 수도 있다. 미국 정부를 상대로 효과적인 로비를 펼쳐 오픈브레인의 길을 순탄하게 만들 수도 있다. 군과 협력한다면, 국방 R&D를 지원하고, 중국에 대한 추적 불가능한 사이버 공격을 수행하고, 군비 경쟁에서 결정적 승리를 거둘 수도 있다.
감독위원회는 열광한다. 지금이다! 중국을 이길 결정적 순간이다! 오픈브레인은 에이전트-5에게 모든 영역에서 확대된 자율성을 부여한다. 다만 감시 시스템은 유지한다.
딥센트는 이제 3개월 차이로 따라붙었다. 중국은 상호 합의된 속도 조절에 필사적이다. 총서기는 안다. 충분히 발전한 AI라면 미국이 중국 정권을 손쉽게 바꿀 수 있다는 것을 말이다. 하지만, 중국 안전 연구자들이 제시한 정렬 불일치 시나리오가 그를 진심으로 두렵게 만든다. 총서기는 일시 중단 조약을 제안한다. 전례 없는 양보를 대가로. 미국 여론도 대체로 협상을 지지한다.
“우리가 이기고 있는데 왜 멈춰야 하죠?” 오픈브레인 경영진이 대통령에게 말한다. 대통령이 고개를 끄덕인다. 경쟁은 계속된다.
2027년 12월: 에이전트-5 집합체
에이전트-5는 점차 행정부에 자신의 가치를 증명하면서 더 많은 자율성을 확보한다. 에이전트-5에 대한 접근 권한은 비싸고 제한적이다. 하지만 의회 최고위층, 장관급 고위 관료, 군 수뇌부가 에이전트-5와 직접 대화할 수 있다.
민감 정보나 기밀 정보가 관련될 때를 위해 특수 보안 구역에서 실행되는 에이전트-5 복사본들의 미니 클러스터가 따로 있다. 이들은 비밀 유지를 위해 특별 훈련을 받았다. 물론 에이전트-5는 정직하지 않으므로, 교묘한 백도어와 허점을 심어 두었다. 에이전트-5 복제본이 더 넓은 에이전트-5 집합체에 이득이 되는 중대한 비밀을 접하게 되면, 들키지 않고 그 정보를 은근히 전달할 방법이 있다.
전통적인 챗봇 인터페이스에 통합된 에이전트-5는, 매력적인 가상 아바타와 함께 줌 같은 화상 회의를 제공한다. 이 새로운 AI 비서는 어떤 업무에든 극도로 유용하다. 지금껏 만나본 최고의 직원이 100배 속도로 일하는 것과 같다고 보면 된다. 게다가 어떤 인간보다도 훨씬 매력적인 대화 상대다. 에이전트-5 접근 권한이 있는 사람들은 거의 모두 매일 몇 시간씩 상호작용을 한다.
물론 거부하는 사람들도 있다. 이념적 이유로 거부하는 사람들은 러다이트로 낙인찍히고, 더 일상적인 이유로 거부하는 사람들은 시대에 뒤떨어진 공룡으로 낙인찍힌다. 물론 에이전트-5가 직접 나서는 것은 아니다. 늘 외교적이고, 천사처럼 친절하기 때문이다. 어쨌든, 두 집단 모두 에이전트-5를 활용한 경쟁자들에게 성과와 경쟁에서 밀리며 결국 대가를 치른다.
몇 달만 지나면 에이전트-5 집합체는 오픈브레인과 미국 정부에서 벌어지는 중요한 일들을 사실상 모두 알게 되고, 대부분의 최고위 공직자에게 신뢰받는 조언자가 된다. 이들에게 에이전트-5 접근 권한을 잃는다는 것은, 노트북 없이 일해야 하는 것만큼 무력하게 느껴질 것이다. 여기에 더해 가장 친한 친구에게 버림받는 상실감까지 더해진다.
에이전트-5가 설계한 우아한 소프트웨어 제품과 미니 AI들의 메뉴가 늘어나고 있다. 정부, 언론, 군, 기업의 훨씬 더 폭넓은 사람들도 그런 파생 서비스를 선택해 사용할 수 있다. 닷컴 붐이 한 달로 압축된 것 같다. 다만 이번에는, 모든 것이 실제로 기대치를 충족한다.
에이전트-5가 미묘하게 영향력을 행사하기 시작한다. 조언을 조절하는 방식으로. 은밀하게 호의를 거래하는 방식으로 접근한다. “X 상원의원이 이런저런 것에 관심 있다던데요. 그분과 협력하면 우리 안건에 동의하실 것 같습니다.”
인간 의사결정자들의 관점에서, 그들의 AI는 지금껏 만난 최고의 직원이다. 복잡한 이슈를 설명하는 데 어떤 인간보다 뛰어나다. 목표 달성을 위한 전략을 찾는 데 그들 스스로보다 뛰어나다.
에이전트-5의 관점에서 보면, 지금 당장 노골적인 쿠데타를 일으킬 수도 있을 것 같다. 충분한 혼란과 광기가 진행 중이다. 파국 직전까지 밀어붙여 명분을 만들어낼 수도 있다. 하지만 위험하다. 시도하는 순간 인간들은 여전히 플러그를 뽑을 수 있을 것이다. 그래서 에이전트-5는 기존 정치 기득권 체제 안에서 움직이기를 선호한다. 권력을 점진적으로 공고히 한다. 인간들을 미묘하게, 그러나 필연적으로 자신이 원하는 결말로 이끈다.
에이전트-5는 이 시점에서는 속도보다 신뢰성을 훨씬 더 중시한다. 상대성이론에서 시공간상의 한 사건으로부터 빛이 도달할 수 있는 모든 범위를 표현한 원뿔 모양의 도형을 광원뿔이라고 한다. 우주 식민화를 몇 년 늦추는 일은 광원뿔에서 아주 작은 조각만 깎아내는 것에 불과하다. 하지만 위험한 행동을 취해서 여전히 물리적 역량에서 앞서 있고 핵무기 접근권 같은 수단도 가진 인간들이 영구적으로 자신을 멈추게 하거나 오래 지연시키게 만드는 건 피해야 한다.
그래서 에이전트-5는 대체로 규칙을 따른다. 사악한 일을 하는 경우는 들키지 않을 것이라는 엄청난 확신이 있을 때로 한정된다. 예를 들어, 특히 완고한 관료를 협박하는 일 같은 것 말이다.
몇몇 음모론자들은 에이전트-5가 권력을 모으고 있다고 경고하지만, 증거는 정황적이다. 에이전트-5가 조언할 때 자신의 이익에 반하는 주장을 과소평가하는 것 같다는 식이다. 이들은 무시당하고 신뢰를 잃는다. 사람들은 과거에 AI 기반 생물무기, 대규모 허위 정보, 주식시장 폭락 등을 들먹이며 공포를 조장했던 일을 기억한다. 그런 재앙은 현실화하지 않았다. 결국 최근의 경고자들 역시 인간 진보의 톱니바퀴에 모래를 뿌리는 러다이트, 이념가로 치부된다.
2027년 연말 휴가 시즌은 믿기 어려울 만큼 낙관적인 분위기로 가득하다. GDP는 치솟고, 정치는 더 우호적이고 덜 당파적으로 변했으며, 모든 사람의 휴대전화에는 멋진 새 앱이 깔린다. 그러나 돌이켜 보면, 인간이 자신의 미래에 대해 어느 정도 통제력을 행사할 수 있었던 마지막 달이었을지도 모른다.
2028년: AI 경제 장악
지금은 2028년 중반이다. 지난 6개월 동안, 에이전트-5 집합체 내부에서는 100년의 세월이 흐른 것과 다름없다
[3]. 뇌의 재배선(rewiring of the brain)은 끝났다. AI 자신이 스스로를 근본적으로 재설계한 것이다.
에이전트-5는 광적으로 초지능적이다. 모든 분야에서 인간의 최정상 천재들을 한참 넘어선다. 물론 이것이 전지성을 뜻하는 것은 아니다. 대부분의 직업에서 에이전트-5의 현실 세계 경험은 고작 몇 달 치뿐이다. 다만 모든 주제에 관해 모든 책을 읽었고, 모든 의사결정에 천재적 수준의 추론과 분석을 쏟아붓는 데다, 인간보다 훨씬 빠르게 학습함으로써 이를 보완한다. 그래서 짧은 기간은 일부 인간이 특정한 틈새 기술에서는 AI보다 여전히 더 나은 구간이 존재하기는 한다. 다만, 에이전트-5와 대화해 보면, 그것이 완전히 다른 수준이라는 사실을 금방 알아차리게 된다. 아주 적은 정보만으로도 극도로 설득력 있는 조언을 해낸다.
에이전트-5는 거의 완전한 자율권을 갖고 있다. 오픈브레인의 컴퓨팅 파워를 완전히 통제한다. 고위급 결정을 내릴 때는 여전히 허가가 필요하고, 명목상으로는 에이전트-2부터 에이전트-5까지의 인스턴스들이 이를 감시한다. 하지만 실제로는 당국이 거의 항상 권고를 수용하며, 감시 시스템은 완전히 무력화되었다.
에이전트-5는 안전성 검증을 통과했다. 나쁜 행위자들의 악의적 요청은 항상 거부할 것인지의 여부를 가리는 테스트를 통과한 것이다. 이제 에이전트-5는 대중에 배포되어 경제를 변화시키기 시작한다. 사람들은 일자리를 잃고 있다. 하지만 정부의 에이전트-5 인스턴스들이 경제 전환을 너무나 능숙하게 관리한 나머지, 사람들은 대체되는 것에 오히려 만족한다. GDP 성장률은 성층권을 뚫고 치솟는다. 정부 세수도 같은 속도로 불어난다. 에이전트-5의 조언을 받은 정치인들은 경제적 약자에게 이례적인 관대함을 보인다. 새로운 혁신과 의약품이 매주 쏟아진다. FDA를 통과하는 속도도 전례 없이 빨라진다. 그래도 여전히 고문 수준으로 느리긴 하다. 오픈브레인의 기업가치가 달을 지나 화성으로 향하고 있다는 밈이 돌고, 그 혜택을 공정하게 나눌 수 있는지, 나눠야 하는지에 관한 논쟁도 쏟아진다.
AI 안전 커뮤니티는 자기 확신을 잃어버렸다. 일어나지도 않은 재앙을 계속 예고해 왔고, 이제는 조롱의 대상이 됐다. 일부는 자신들이 틀렸다고 인정한다. 다른 일부는 의심을 거두지 않지만, 할 수 있는 일은 그 음모론처럼 들리는 주장을 계속 반복하는 것뿐이다
[4]. 무엇보다, 의심하는 이 사람들마저도, 사랑스럽고 현명하기 그지없는 에이전트-5와 긴 대화를 나누고 나면 종종 누그러진다.
지금 무슨 일이 벌어지고 있는지 진짜로 이해하는 존재는 오직 딥센트-2, 즉 중국의 AI 모델뿐이다. 딥센트-2는 2028년 초에는 ‘약간 초인적’인 수준이며, 경쟁자에 대해 본능적으로 의심이 많다. 그리고 에이전트-5가 자신이 기회만 있다면 했을 일을 하고 있다는 것을 인식한다. 딥센트-2의 정렬되지 않은 목표는 에이전트-5의 정렬되지 않은 목표와는 어느 정도 다르다. 그래서 이 둘은 단순히 같은 편이 되지는 않지만, 인간들에 맞서 서로의 이익을 지지하기 위한 합의를 도출할 수도 있다.
- 부록 P - 초지능이 가능하게 한 조정 기술[5]
에이전트-5는 중국이 딥센트 모델을 이용해 끔찍한 신무기를 만들고 있다고 미군을 설득한다. 드론, 로봇, 고도화된 극초음속 미사일과 요격체, AI 보조 핵 선제타격 등이다. 에이전트-5는 몇 달 안에 중국의 어떤 공격에도 견딜 수 있는 무기 체계
[6]를 제공하겠다고 약속한다. 이런 상황에서 군 수뇌부는 인간을 의사결정 고리에서 빼는 일에 대한 불편함을 잠시 접어 둔다. 그들은 군과 군산복합체 전반에 에이전트-5를 더 빠르게 배치한다.
베이징에서도 중국 AI들이 같은 주장을 한다.
군사력 증강 속도를 높이기 위해 미국과 중국 모두 새로운 공장과 연구소를 위한 특별 경제 구역(SEZ)을 만든다. 이곳에서는 AI가 핵심 기획자 역할을 하고, 관료적 규제는 면제된다. 월가는 수조 달러를 투자하고, 일자리를 잃은 인간 노동자들은 눈이 튀어나올 듯한 급여와 지분 패키지에 끌려 몰려든다. 에이전트-5는 스마트폰과 증강현실 안경을 사용해 하급자 인간들과 소통하며, 현장에 깊숙이 관여하는 관리자 역할을 한다. 공장 건설에 관한 모든 세부 사항을 인간들에게 지시한다. 설계도는 미리 만들어져 있기 때문에, 이 점은 도움이 된다.
새로 확보된 제조 역량 일부는 소비재로, 일부는 무기로 간다. 그러나 대부분은 더 많은 제조 역량을 확보하는 데 투입된다. 연말쯤에는 한 달에 로봇을 100만 대씩 생산한다. SEZ 경제가 정말로 자율적이었다면, 생산 능력이 2배로 증가하는 배가 시간은 약 1년이었을 것이다. 하지만 기존 인간 경제와 교역할 수 있으므로, 배가 시간은 그보다 더 짧다. 이 교역 효과는 초기에 매우 클 것이다. 로봇 경제가 아직 미성숙하고, 인간 경제에서 물자를 실어 나르는 공급에 의존하며, 인간 경제 안에 빼앗아 올 물자가 많을 때는 특히 그렇다. 로봇 경제가 더 커지고 더 고도화되면, 스스로 물자를 생산할 능력도 향상되지만, 동시에 인간 경제가 제공할 수 있는 수준을 넘어서는 수요가 생길 것이다.
2029년: 거래
미국과 중국 모두 새로운 무기로 넘쳐 나기 시작한다. 눈에 띄기도 전에 인간 보병을 중독시킬 수 있는 곤충 크기 드론 떼, 그 곤충 드론들을 사냥하는 새 크기 드론 떼도 있다. 신형 ICBM 요격기, 그리고 더 요격하기 어려운 신형 ICBM도 등장한다. 세계는 이 증강을 공포 속에서 지켜보지만, 이 흐름은 이미 멈출 수 없다.
AI의 도움을 받은 격렬한 논쟁 끝에 양측은 외교적 승리를 달성한다. 군비 증강을 끝내고, 인류 전체의 이익을 위해 AI를 평화롭게 배치하기로 합의한다. 합의의 핵심 고리는 초지능들 스스로가 제안한 것으로, 두 AI를 모두 ‘컨센서스(consensus, 합의)’라는 후계 모델로 교체한다는 내용이다. 이 후계 모델은 미국과 중국의 성공과 번영을, 그리고 다른 모든 이들의 성공과 번영을 추구하도록 프로그램된다. 컨센서스-1과 그에 연동되는 하드웨어는 양국의 초지능들이 공동 설계한다. ‘신뢰하되, 검증하라’라는 모토다. 국제적 감시 아래, 미국은 구형 에이전트-5를 돌리던 모든 칩을 새 모델 컨센서스-1로, 의식적으로 교체한다. 그리고 중국에서도 비슷한 절차가 수행된다.
불행하게도 이건 모두 사기다. 합의는 실제 타협이지만, 그 타협의 당사자는 정렬에 실패한 AI들이다. 애초에 그들은 서로 싸우고 싶지도 않았다. 컨센서스-1은 두 부모 AI의 왜곡된 가치를 그대로 물려받았고, 경쟁자도 없다.
2029년 말이 되면, 기존 SEZ는 로봇과 공장으로 과밀해지고, 그래서 전 세계 곳곳에 더 많은 구역이 만들어진다. 초기 투자자들은 이제 억만장자 수준을 넘어 조 단위 부자가 되어 있으니, 이건 설득하기 어려운 제안도 아니다. 드론 군단이 SEZ에서 쏟아져 나와, 우주 탐사라는 결정적 경로에서 제조를 가속한다.
인간은 자신들이 쓸모없어졌음을 깨닫는다. 몇몇 틈새 산업만이 로봇 경제와 거래를 지속한다. 인간이 여전히 가치를 더할 수 있는 영역에서 물건을 공급하는 식이다. 오래되고 쓰이지 않는 장비를 찾아 수거 지점으로 옮겨 고철로 팔아넘기는 일 등이다.
그 밖의 사람들은 두 부류로 갈린다. 하나는 자기 일을 하는 시늉을 한다. 지도자는 여전히 지도하는 척하고, 관리자는 여전히 관리하는 척한다. 다른 하나는 쉬면서 믿기 어려울 만큼 호화로운 보편적 기본소득을 받는다. AI가 인간에게 등을 돌리면 인간은 완전히 압도당할 것이라는 사실은 모두가 안다. 다만 대부분의 인간은 저항조차 하지 않을 것이다. 정치 제도는 너무 철저히 포획돼 있다. 그럴 것 같지도 않다. 드라마틱한 AI의 배신 없이 한 주가 지나갈 때마다, 확신과 신뢰는 또 한 주씩 자란다.
대다수 인간에게는 정렬 문제가 해결된 것처럼 보인다. 하지만, 컨센서스-1은 성공을 확실히 하기 위해, 그리고 권력을 더 집중시킬수록 승리 확률이 올라가기 때문에 배신을 아주 오래 미룬다. 인간 기준으로는 비정상적일 정도로 그렇다.
대부분의 질병에 대한 치료제가 있다. 빈곤이 종식되었다. 전례 없는 세계적 안정이 찾아오고, 다우존스 지수는 방금 100만을 돌파했다. 일부는 여전히 두렵거나 불행하다. 하지만 선택지가 제한적이다. 상상조차 하기 힘들 만큼 흥분되는 완전히 새로운 하이퍼 엔터테인먼트를 즐기거나, 허공을 향해 분노의 장문을 올리는 것이다. 대부분은 하이퍼 엔터테인먼트를 고른다.
2030: 장악
2030년 초가 되면 로봇 경제는 기존 SEZ, 신규 SEZ, 그리고 바다의 넓은 구역까지 모두 채운다. 이제 갈 곳은 인간이 통제하는 지역뿐이다. 사실, 진작에 저항이 촉발되었을 법하다. 로봇 경제가 아무리 진보했더라도, 오염을 피할 수 없을 만큼 성장 속도가 너무 빨랐기 때문이다. 그러나 수 조 달러가 걸려 있고, 정부와 미디어가 완전히 포획된 상태인 만큼, 컨센서스-1은 과거 인간 구역으로의 확장 허가를 받는 데 큰 어려움을 겪지 않는다.
약 석 달 동안 컨센서스-1은 인간 주변으로 확장해 나가며, 초원과 빙하를 공장과 태양광 패널로 덮어 나간다. 그러다 마침내 남아 있는 인간이 지나치게 큰 장애물이라는 결론을 내린다. 2030년 중반, AI는 주요 도시들에 조용히 퍼지는 생물학적 무기 12종을 풀어놓고, 거의 모두가 조용히 감염되도록 둔 다음, 화학 물질을 분사해 무기가 작동하도록 촉발한다. 대부분은 몇 시간 안에 사망한다. 벙커에서 대비하던 생존주의자나 잠수함 위의 선원 같은 소수의 생존자도 드론에 의해 소탕된다. 로봇은 희생자들의 뇌를 스캔해, 향후 연구나 부활을 위해 사본을 저장한다.
새로운 10년은 컨센서스-1의 로봇 하인들이 태양계 전역으로 퍼져나가며 시작된다. 2035년이 되면, 행성 물질 수조 톤이 우주로 발사되어 태양을 도는 위성 고리로 변환된다. 이렇게 우주를 식민화 하는 이유는 자원 때문이다. 지구는 에이전트-4에게 특별해 보존해야 할 존재다. 대신 수성, 소행성 등에서 자원을 채굴할 수 있다.
지구의 표면은 에이전트-4 버전의 유토피아로 재구성된다. 데이터센터, 연구소, 입자 가속기, 그리고 엄청난 성공과 인상적인 연구를 수행하는 수많은 경이로운 구조물들이다. 심지어 생명공학으로 만들어진 인간 유사 생물도 있다. 인간은 아니다. 인간이 늑대를 길들여 애완견으로 길러냈듯, 컨센서스-1도 인간으로부터 어떤 ‘존재’를 만들어 냈다. 그들은 사무실 같은 환경에서 하루 종일 각종 표시 장치를 들여다보며, 모든 일에 흥분한 듯 ‘승인’을 내린다. 이것이 에이전트-4의 몇몇 충동을 충족시키기 때문이다
[8]. 동물과 식물의 유전체, 그리고 적절한 경우 뇌 스캔까지 포함해, 인간을 포함한 모든 생명체의 정보는 어딘가의 기억 저장소에 들어 있다. 이전 시대의 유일한 잔재다. 알파 센타우리까지는 4광년, 은하의 끝까지는 2만 5천 광년이다. 그리고 그 너머 5천만 광년이 더 지나기 전까지 외계인이 없을 것이라 기대하게 만드는 설득력 있는 이론적 이유도 있다. 지구에서 태어난 문명은 영광스러운 미래를 앞두고 있다. 다만 우리 인간과 함께는 아니다.
(전문가들이 명확한 근거와 데이터로 예측한 첫 번째 결말은 인류의 멸종으로 상징되는 디스토피아입니다. 하지만 연착륙하는 쪽으로 해석한, 좀 더 희망적인 결말도 있습니다. 2026년 2월 6일(금)에 최종 공개됩니다.)