대전이 노잼이 된 이유는 뭘까? 부산이나 광주처럼 두드러지는 사투리나 지역색도 없고, 경포대나 지리산 같은 자연 관광 자원이 없어서일까? 사람들은 대전이 노잼이기 때문에 이미지에 타격을 입고, 관광 경쟁력이 떨어진다고 진지하게 호들갑을 떨었다. 하지만, 정작 ‘노잼’과 대전 사이 연계성과 내용을 상세히 파헤친 적은 없었다. 대전이 ‘노잼도시’로 불리는 현상의 본질은 무엇일까?
소셜 미디어 밈(meme)으로 시작했으니 소셜 미디어를 파봐야 했다. ‘노잼의 도시 대전’이란 말은 대전에 대한 일종의 지식이자 인식이다. 그 지식과 인식이 어디에서, 어떻게 생겨난 것인지 알아야 했다. 이런 연구 질문을 던졌다, ‘소셜 미디어 텍스트에 언급된 ‘노잼도시’는 무엇일까?’ ‘대전과 ‘노잼도시’는 어떤 관계가 있는 걸까?’
소셜 미디어에 사람들이 아무렇게나 쏟아 낸 엄청난 양의 말을 컴퓨터 프로그램으로 긁어모아(크롤링) 형태소별로 분류, 분석해 보기로 했다.
[10] 분석을 위해서는 일반적으로 문장 속 명사, 형용사와 동사를 추출해 정제한다. 가장 자주 쓰인 단어는 무엇인지, 어떤 단어가 얼마만큼의 무게감을 가지고 사용되는지 살펴본다. 단어끼리 어떤 관계를 맺는지도 살핀다. 단어 사이 관계는 문장을 형성하고 이야기를 만들어 낸다. 몇 개의 이야기가 모이면 그 문서의 주제가 드러난다. 사람들은 소셜 미디어에 그냥 말을 뱉는 경우가 많지만, 이런 ‘텍스트 마이닝’의 과정을 거치면 어수선한 말과 이야기들 속에 확실한 규칙과 의도가 있음을 알게 된다.
“노잼 (띄고) 도시”를 검색어로 블로그 문서를 크롤링했다. 사람들은 소셜 미디어에서 ‘노잼 도시’와 ‘노잼도시’를 혼용해서 쓴다. 어떤 경우엔 ‘노잼의 도시 대전’이라고 초기 밈의 말을 그대로 쓰기도 했다. 텍스트를 작성한 목적이 ‘노잼’을 강조하는 것이라면, ‘노잼’과 관련한 문서들도, ‘노잼 도시’를 모두 포함한 문서들도 다 모아 봐야 했다. ‘노잼’ 자체가 어떤 단어들과 관계해 새로운 의미를 만들어 내는지를 보고, 그 단어 자체의 성질과 특성을 파악했다. 문서 수집 키워드는 ‘노잼 도시’를 사용했다. 크롤링 키워드로는 ‘노잼 도시’를 썼지만, 어떤 장소성을 의미하는 말인 ‘노잼도시’는 일종의 고유 명사다. 이 책에서 도시의 특성이나 이미지를 뜻하는 ‘노잼인 도시’의 장소성을 의미하고 싶을 때는 ‘노잼’과 ‘도시’를 붙여 ‘노잼도시’로 쓴다.
2015년부터 2021년 8월까지 생산된 블로그 포스트를 대상으로 텍스트 마이닝을 진행했다. 쌍방 소통에 중점을 둔 SNS는 인맥 관리와 유지가 중요하다. 트위터
[11]는 짧게 자신의 의견을 피력하고 같은 생각을 하는 사람들과 신속하게 공유하고 피드백을 받는다. 글자 수 제한과 오래된 트윗은 보관하지 않는다는 기술적 특성으로 인해 트위터 텍스트는 이슈 중심 혹은 시급성을 특징으로 한다. 인스타그램은 텍스트보다 이미지 중심이며, 해시태그 검색을 통해 원하는 이미지를 검색하는 데 활용되는 경우가 많다. 이미지 중심이다 보니 전시 효과와 과시에 방점이 찍힌다는 특징이 있다.
[12] 블로그는 ‘좋아요’나 ‘리트윗’ 등의 즉각적 반응보다 개인의 서사를 만들어 내는 데 더 치중하는 편이다. 한국의 블로그가 서구처럼 개인 콘텐츠를 적극적으로 생산한다고 보긴 어려워도, “개인화된 공간으로서 감성적 자기 표현과 의미 세계의 기록이 선명하게 드러나는 일상의 공간
[13]”임은 분명하다. 블로그는 편집되지 않은 자신의 이야기나 정보 등을 자유롭게 기록하는 일기 형태의 미디어다. 포스트 수는 2021년 12월 3000만여 개에 이르며, 이용자의 70퍼센트가 20~30대다.
[14] 블로그는 장소 경험이나 기억, 생각을 드러내는 데 사용되는 경우가 많아
[15], 연구 대상으로 적합했다.
2017년 4월, ‘노잼도시 알고리즘’에 대한 첫 언론 보도가 있었다. 2015년 1월 1일부터 블로그에 쓰인 텍스트를 크롤링했다. 6년 8개월 동안 생산된 블로그 포스트 중, 중복 문서를 제외하고, “노잼 도시” 검색어를 포함한 문서 5875개를 최종 분석 대상으로 결정했다. ‘노잼 도시’ 문서는 2015년엔 336개, 2019년엔 1037개, 2021년 8월엔 1042개로 점차 증가하는 추세를 보였다. 최종 분석 대상 형태소 4만 1704개다.
비로소 완성된 밈, 노잼도시
하나의 문서 안에서 어떤 단어가 자주 등장하면 대체로 중요한 단어일 경우가 많다. 강조하고 싶을 때 우린 한 단어를 여러 번 얘기하지 않나. 그래서 텍스트 마이닝에서는 문서에 쓰인 단어의 빈도를 측정한다. 하지만 단순히 많이 등장한다고 해서 중요한 단어는 아니다. 한 문서에 쓰인 단어의 단순 빈도(Term Frequency)뿐 아니라, 문서마다 계속 등장하는 단어의 역수(Inverse Document Frequency)를 구해, 단어의 무게감(TF-IDF·Term Frequency-Inverse Document Frequency)
[16]을 측정한다. 일반적으로 쓰이는 단어를 거르고, 맥락상 진짜 중요한 단어를 찾아내는 것이다. 2015년에서 2021년 8월까지 ‘노잼 도시’ 키워드를 포함한 5875개의 문서에서 가장 빈번하게 등장한 단어는 ‘대전’이었다. 모두 2만 974회 쓰였다. 단순하게 쓰인 빈도만 봤을 때 두 번째로 많이 쓰인 단어는 ‘사람’으로 1만 4377회, 그리고 그다음으로는 ‘생각’이 1만 2030회 쓰였다. ‘여행’이나 ‘사진’ 그리고 ‘맛있다’ 등도 자주 쓰인 단어 10위 안에 들었다.
‘대전’이 ‘노잼 도시’를 포함한 문서에서 가장 자주 등장한 단어이긴 하지만, 그건 단순 출현 빈도에 불과하다. 진짜 대전이 중요한 단어인지를 TF-IDF 값을 통해 확인했다. 특히 연도별로 문서에 쓰인 단어들의 무게감을 측정했을 때, 의미있게 쓰인 단어들의 변화를 파악할 수 있었다.
2015년에 작성된 ‘노잼 도시’ 블로그 텍스트에는 ‘게임’과 ‘사람’의 비중이 크고 ‘영화’도 중요한 단어로 쓰인다. ‘독일’이나 ‘호텔’ 등도 눈에 띈다. ‘노잼 (띄고) 도시’로 문서를 검색했기 때문에, 노잼인 게임과 노잼인 도시 베를린이 포함된 문서가 크롤링된 것이다. 2016년과 2017년에도 일반적으로 블로그에 많이 등장하는 단어인 ‘생각’과 ‘사람’이 비중 있게 쓰인 가운데, 영화와 여행의 비중이 커졌다. 2018년엔 처음으로 ‘대전’이 등장한다. 하지만, 아래 워드 클라우드에도 보이듯, 2018년에 등장한 대전의 비중은 아주 작다. 이때까지도 ‘노잼 도시’가 포함된 블로그 문서들은 세상 모든 재미없는 것들에 대해 이야기하고 있다고 해도 과언이 아닐 만큼 다양한 것들을 이야기하고 있다. 재미없는 사람(친구), 시간, 생각, 게임, 영화, 여행(지) 등 여러 이야기가 난립했지, 특정 사건이나 사람 혹은 장소는 큰 비중을 차지하지 못했다.
2019년부터는 달랐다. 블로그 유저들의 ‘노잼 도시’ 포스팅에 큰 변화가 감지됐다. ‘대전’이 블로그 텍스트의 가장 무게감 있는 단어
[17]로 등장한 것이다.
2019년 ‘노잼 도시’ 블로그 텍스트에서 ‘대전’이 차지하는 무게감은 약 0.0172로 나타나는데, 이 값은 2위인 ‘사람’ 0.0068의 두 배 이상 크다. 2019년에 등장한 단어 ‘대전’의 중요성은 시간이 흐를수록 커졌다. 2020년엔 0.0256이었고, 2021년 8월엔 0.0279로 2위인 ‘카페’ 0.0071과 큰 차이를 보였다.