빅데이터, 빅퀘스천
완결

빅데이터, 빅퀘스천

삶의 기록, 데이터


자산, 금맥, 원유, 블루오션 등 빅데이터에 대한 다양한 비유는 전 세계 미디어가 빅데이터를 어떻게 인식하고 있는지 보여 주는 단적인 예다. 오늘날 빅데이터는 자본의 증식, 부의 창출의 연장선에서 이해되고 있다. 기업들은 소비자 심리와 트렌드를 파악하고 공정상의 문제를 잡아내는 데 빅데이터를 활용한다. 정부와 국회는 빅데이터를 기반으로 시민의 뜻을 확인하고 선거에 적극적으로 활용한다. 학계에서는 앞다투어 빅데이터 관련 학과를 개설하고 학술 대회를 개최한다. 범죄 예방과 치안 유지, 의료 등 공공 영역에서도 빅데이터 이용이 활발하다. 이제 빅데이터 전문가는 유망 직업군 가운데 하나가 됐다. 빅데이터는 비용 절감, 가치 창출을 가능하게 하고 무엇보다 기존 방식으로는 얻기 어려운 해답을 제공해 줄 것이라는 기대를 한 몸에 받고 있다.

하지만 빅데이터가 정말 장밋빛 미래만을 보장하고 있을까? 빅데이터는 문자 그대로 많은(big) 정보(data)를 의미한다. 흔히 용량(volume), 빠른 속도(velocity), 다양성(variety)으로 대표되는 3V라는 용어로 설명되기도 한다. 그러나 빅데이터를 단순히 어마어마하게 많고, 처리 속도가 빠르며, 형태가 다양한 데이터의 군집 정도로만 인식한다면 빅데이터의 본질적인 의미와 가치를 놓치게 된다.[1] 흔히 빅데이터를 황금, 원유와 같은 경제적 가치로 생각하지만 데이터 자체는 가치 중립적이다. 빅데이터를 어디에 사용하고 어떻게 해석하느냐에 따라 빅데이터 기술이 갖는 가치는 달라질 수 있다는 뜻이다.

빅데이터의 출발은 대량의 데이터를 분석했던 클라우드 컴퓨팅 기술이라고 볼 수 있다. 그러나 클라우드 컴퓨팅 기술은 비용 대비 효과가 낮았다. 수십억 원을 들여야만 대용량 데이터를 분석할 수 있었다. 그렇기에 과거의 데이터 분석은 정부 차원에서만 실행할 수 있는 기술이었다.[2] 데이터의 이용 주체가 정부에서 기업으로 확대된 것은 기업이 보유하고 있는 고객 데이터를 활용해 마케팅을 활성화하는 고객 관계 관리(CRM·Customer Relationship Management)를 본격적으로 시작한 1990년대부터다. 기업은 데이터 활용으로 다양한 마케팅 활동을 벌였고 이를 통해 고객 유지와 이탈 방지라는 소기의 목적을 달성할 수 있었다. 구매 이력 정보와 웹로그(web-log) 분석, 위치 기반 서비스(GPS)와 결합해 소비자가 원하는 서비스를 적기에 적절한 장소에서 제안할 수 있는 기술 기반도 갖추게 됐다.[3] 기업의 목적을 달성하기 위한 효율적인 수단이었던 빅데이터는 최근 10년간 그 활용 범위가 확대되면서 우리 삶 속에 더 깊숙이 들어오게 됐다.

구글은 2008년 감기와 관련된 검색어가 급증하는 것을 보고 미국 내에서 독감이 유행할 것이라는 예측을 내놓았다. 미국 질병 통제 센터보다 약 2주나 빨랐던 예측은 적중했고, 구글은 가장 유입량이 많은 검색어, 최신 트렌드와 정보를 한눈에 알 수 있는 구글 트렌드 사이트를 만들었다. 구글 트렌드는 지금까지 전 세계의 굵직굵직한 사건들을 예견하는 역할을 하고 있다. 빅데이터를 기반으로 시청자들의 취향과 선호 드라마 장르, 감독, 배우 등을 분석해 제작된 넷플릭스 드라마 〈하우스 오브 카드(House of Cards)〉가 에미상 3관왕을 차지한 것이 2013년의 일이다. 이제는 전 세계 1억 명 이상의 이용자들이 넷플릭스에서 빅데이터가 선별하는 TV 프로그램과 영화를 즐겨 보고 있다. 가로등, 쓰레기통, 주차장과 결합한 인공지능 기술이 도시 전체의 정보를 모으고 관리하는 스마트 시티는 현실이 된 지 오래다. 스페인 바르셀로나가 스마트 시티 실험을 시작한 것이 지난 2013년이다.

구글과 넷플릭스, 바르셀로나의 사례는 빅데이터가 이미 우리 삶에 들어와 있으며, 삶의 질을 높이는 수단으로 자리매김했다는 사실을 보여 준다. 비즈니스 영역이든 공공 영역이든 빅데이터는 현재 가장 많이 쓰이며 반드시 필요한 기술이라는 데 누구도 이견이 없는 것처럼 보인다.

빅데이터의 위험성을 경고하는 목소리는 잘 들리지 않는다. 그러나 빅데이터는 개인의 사전 동의 없이 프라이버시를 침해하는 빅브라더가 될 수도 있고, 데이터 분석 과정에서 조작과 오독으로 피해자를 낳을 수도 있다. 빅데이터는 만능열쇠가 아니다. 빅데이터의 효용이 모든 영역에 적용되지는 않는다는 점을 인식해야 한다.

 

프라이버시 침해; 당신의 데이터는 당신의 것인가


빅데이터를 논할 때 가장 먼저 던져야 할 질문은 데이터의 주인이 누구냐는 것이다. 기업과 정부가 제공하는 모든 데이터의 주인은 당연히 우리다. 우리는 일상생활에서 수많은 데이터를 만들어 낸다. 스마트폰의 GPS 기능은 사용자의 위치를 구글 맵스나 다음, 네이버 지도 위에 표시한다. 내가 페이스북에서 ‘좋아요’를 누르고 공유한 게시 글은 다른 사람들의 피드에 나타난다. 페이스북은 내가 올린 게시 글에 포함된 개인 정보를 데이터로 인식하고 수집한다. 과거의 병력이나 심리적 상태가 대표적인 예다. 타인의 메일함에는 내 휴대폰의 운영 체제부터 접속 일자와 시간이 낱낱이 공개된다. 데이터들은 무차별적으로 수집되고 가공되며 재사용된다. 그리고 직접 거래를 하지 않거나 매우 제한적인 거래를 하고 있는 제3자들에 의해 동의 없이 사용된다.[4]

데이터의 소유주는 우리 자신이어야 한다. 하지만 실제로 데이터 사용자들의 인식은 그렇지 않다. 일부 기업가들은 타인의 정보를 수집하고 사용하는 것을 당연시하며, 이를 통해 이득을 얻고자 한다. 온라인 데이팅 회사 OK큐피드(OK Cupid)를 운영하면서 상당한 양의 데이터를 축적했던 크리스천 러더(Christian Rudder)는 “사람들은 터무니없는 생각은 물론, 남의 마음에 상처를 주는 생각까지 검색창에 털어놓는다”고 말했다. 내밀하게 토로된 데이터는 사람들의 속내를 대변하는 정보가 된다. 러더는 기업가인 자신이 그 정보들을 유용하게 사용하고 있다고 덧붙인다.[5] 알리고 싶지 않은 비밀들이 데이터로 저장되어 각종 비즈니스에 활용되는 것이다.

경영 전략 컨설턴트 토머스 데이븐포트(Thomas H. Davenport)는 빅테이터에서 비롯된 일상의 편의성을 강조한다. 빅데이터는 인터넷 쇼핑몰에서 이용자가 둘러본 상품과 구매 내용을 분석해 취향에 맞는 제품을 자동으로 추천하고, 구글 메일과 검색 자료를 바탕으로 관심이 있을 법한 광고를 보여 준다. 사람이 일일이 개입하지 않아도 컴퓨터가 알아서 적절한 판단을 내린다.[6] 그는 빅데이터가 야기하는 부작용에 대해서는 언급하지 않는 대신 미국 사람들의 일반적인 사고방식을 설명한다. 미국인들은 구글과 페이스북 같은 서비스를 무료로 이용하면서 자신들의 데이터가 비즈니스에 활용되는 것을 ‘공짜의 대가’로 인식한다. 개인 정보 유출의 위험은 구글과 페이스북을 조건 없이 사용하기 위해 감수해야 할 리스크라는 논리다.

개인 정보 유출의 위험이 사용 대가와 등가를 이룬다는 데이븐포트의 지적은 생각할 거리를 던져 준다. 개인의 쿠키 정보와 SNS 게시물, 위치 정보는 온라인 맞춤 광고를 제공한다. 구매 정보는 고객의 신분과 성향을 분석한다. 의료 데이터는 질병을 예측하고, 범죄 데이터베이스를 통한 시스템은 범죄를 예방하고 감시한다.[7] 그러나 우리는 빅데이터 사용이 샘플 조사가 아닌 전수 조사를 기반으로 한다는 점을 유념해야 한다. 빅데이터는 정보 공여를 원하지 않는 개인의 정보까지 포함한다. 사용자 측에서는 개인 식별이 불가능한 장치를 사용한다고 주장하지만 지금껏 수없이 발견된 개인 정보 유출 문제를 해명하기에는 무리가 있다.

빅데이터는 사회적 기여라는 수식어를 동반하곤 하지만 이 과정에서 인간은 소외되고 개인 정보는 도구화된다. 사회적 기여라는 맥락에 대해서도 생각해 볼 필요가 있다. 여기서 사회는 공공의 이익이 아니라 기업의 이익을 지칭하는 경우가 많다. 데이터의 주인이 누구인지 묻는 질문조차 기업가들에게는 중요하지 않다. 기업의 이익, 성공적인 비즈니스 모델이 항상 개인과 사회의 이익으로 이어지는 것 역시 아니다. 프라이버시의 침해가 암묵적으로 용인되는 현실에서 빅데이터는 과연 무엇을 위해 사용되어야 할까.

 

조작과 오독; 데이터는 사실일까


미국의 저명한 소설가이자 사회 비평가 마크 트웨인(Mark Twain)은 “통계는 거짓말”이라고 했다. 많은 사람들이 빅데이터를 통해 미래를 정확하게 예측할 수 있다고 믿는다. 하지만 데이터는 읽힐 때 의미가 있다. 읽힌다는 것은 해석된다는 것이다. 분석과 해석을 거치지 않은 데이터는 무의미한 단어의 집합에 불과하다. 사람들은 빅데이터가 엄정한 과학에 기댄 정확한 기술이라고 믿지만 빅데이터의 유용성은 쓸모 있는 데이터를 발굴하고 해석하는 데 달려 있다. 그리고 이 과정에는 인간의 선입관이 작용하기 쉽다. “데이터가 무책임한 사람들의 손에 들어갈 경우 현실 마이닝(reality mining, 휴대폰, GPS 등 휴대 기기를 통해 사람들의 이동 경로, 통화 내용, 접촉하는 사람들과 같은 정보를 파악하는 것)의 힘은 끔찍한 결과를 초래할 수 있다”[8]는 빅데이터 전문가들의 염려는 여기에서 비롯된다. 19세기 활동가 마크 트웨인이 비판한 기존 통계 방식의 맹점이 빅데이터 시대에도 발견되는 이유다.

2012년 미국 대통령 선거에 출마한 공화당 후보 뉴트 깅리치(Newt Gingrich)는 “내 트위터 팔로워 수가 다른 후보들의 팔로워를 합친 것보다 여섯 배나 많다”며 유세를 떨었다. 그러나 이 가운데 90퍼센트는 그의 선거 운동 본부에서 매수한 가짜 팔로워들이었다. 같은 공화당 후보였던 밋 롬니(Mitt Romney) 역시 단 몇 분 만에 팔로워 수가 20배 가까이 증가하면서 가짜 팔로워들을 구입한 정황이 드러났다. 조작에 의해 형성된 갑작스러운 팔로워 증가를 21세기판 ‘워터게이트’로 볼 수 있다는 의견은 결코 과장이 아니다. 빅데이터에 대한 맹목적인 확신과 믿음이 공동체 내부의 신뢰를 붕괴하는 요인이 될 수도 있기 때문이다.

한국의 사정도 크게 다르지 않다. 국내 정치와 경제계는 데이터 조작 사건으로 연일 몸살을 앓고 있다. 특정 기관의 정책, 선거와 관련된 댓글 조작, 기업이 개입한 홍보 댓글 등 목적성을 띤 데이터가 온라인 세상에서 증식하고 있다. 고의적인 온라인 댓글 작업을 통해 소기의 목적을 달성하려는 노력은 일부 정치인이나 기업인에게만 국한된 것도 아니다. 국내외의 다양한 사례는 빅데이터에서 도출된 결과가 상대적으로 더 중요하고 유용할 것이라는 공식이 언제나 성립하지는 않는다는 사실을 보여 준다. 자본과 의도가 충분하다면, 빅데이터 조작은 악의적으로 이뤄질 수도 있다. 빅데이터 사용자에게 윤리 의식이나 도덕적 감수성을 강제할 수 있는 방법 또한 쉽지 않다.

빅데이터를 해석하는 과정에서 오독의 문제도 발생한다. 데이터로부터 유의미하고 가치 있는 정보를 찾기 위해서는 데이터 마이닝(data mining)이 필요하다. 데이터 마이닝이란 많은 데이터에 숨겨진 상관관계를 발견하고 미래에 실현 가능한 정보를 추출해 내는 과정이다.[9] 그런데 이 빅데이터의 핵심을 차지하고 있는 것이 바로 웹, 이메일, SNS 등에서 이뤄지는 비정형 데이터다. 비정형 데이터는 담고 있는 의미가 매우 다양해[10] 인간의 개입 없이 기계적으로만 해석될 경우 오독의 함정에 빠지기 쉽다.

기계는 데이터를 모을 수 있지만 자기 과시를 위한 글, 위로받기 위한 감정의 분출, 거짓말, 행간에 숨겨진 의미 등 인간의 세심한 정서까지 정확하게 읽어 내지는 못한다. 특히 문맥을 고려해야 하는 다의어, 유머, 풍자, 아이러니와 같은 복잡한 표현을 분석할 때 오류가 발생한다. 따라서 데이터를 기계적으로만 분석한다면 때로 잘못된 해석이나 결론에 도달할 수 있다. 현재까지 상용화된 스마트폰의 음성 인식 서비스도 기계적인 분석을 벗어나지 못하는 것을 보면 복잡하고 다층적인 인간의 언어를 해석하기에는 시간이 좀 더 필요해 보인다. 효율성과 효용성을 근거로 기계에 모든 해석을 미루는 일은 오히려 오독을 심화시킬 수 있다.

 

존엄성과 생명의 문제; 데이터는 인간의 미래를 예측할 수 있는가

 
“빅데이터는 사람들의 행동을 예측한다. 사람들이 사랑하고, 일하고, 출산하고, 이혼할 확률을 예측한다. 투표 성향, 판단, 의사 결정을 예측한다. 이직하고, 그만두고, 갈아탈 확률을 예측한다. 누가 사고를 낼 것인지 예측한다. 누가 병들고 죽을 것인지 예측한다. 누가 거짓말하고, 속이고, 훔치고, 살인할지 예측한다.”[11]
에릭 시겔, 《빅데이터의 다음 단계는 예측 분석이다》

실제로 빅데이터는 개개인의 성향과 좋아하는 물건, 이직 가능성을 예측한다. 그러나 누가 사고를 내고 누가 훔칠 것이며 누가 살인할 것인지, 누가 아프고 죽을 것인지에 대한 예측은 그 효용성에도 불구하고 위험성을 내포하게 된다. 특히 인간의 존엄성과 생명과 관련된 영역에서 빅데이터 활용은 양날의 검이다. 현재 범죄 예방 및 치안 영역에서 빅데이터 활용은 긍정적인 측면이 강조되는 경향이 있다. 흔히 접할 수 있는 기사의 구체적인 내용은 다음과 같다.

“싱가포르와 미국의 경우 테러를 막고 범죄자를 색출하기 위해 빅데이터를 활용한다.”[12]

“프레드폴(PredPol, 범죄 예측 서비스)[13]을 사용하고 있는 영국의 켄트 경찰서는 ‘어느 지역을 순찰해야 하는지를 알려 주는 것은 아주 중요하다’며 프레드폴 도입 이후, 14만 건에 이르렀던 범죄가 10만 건으로 줄었다고 설명했다.”[14]

“2011년 7월 미국 캘리포니아주 산타크루스 주차장에서 ‘예비 자동차 절도범’ 두 명이 체포됐다. 자동차 안을 엿보던 모습이 때마침 현장에 있던 경찰관들에게 적발됐다. 이들을 수색하던 경찰관이 주머니에서 마약도 발견했다. 이들은 곧바로 구금됐다. 당시는 산타크루스 경찰이 범죄 예측 프로그램인 프레드폴을 도입한 직후였다. 경찰은 ‘그 장소에서 차량 절도가 발생할 것으로 예상된다’는 프레드폴의 예측으로 현장에 미리 대기하고 있었다. 이 사건을 보도한 《뉴욕타임스》는 ‘경찰이 예지력을 갖는 것은 이제 평범한 일이 됐다’고 평했다.”[15]

빅데이터를 통해 인간이 예지력을 갖게 됐다는 기사는 빅데이터라는 믿을 만한 첨단 과학을 통해 미래를 통제할 수 있게 됐다는 기대로 읽힌다. 캘리포니아주 산타크루스시는 범죄 예측 시스템을 통해 강도 사건 중 25퍼센트를 정확하게 예측했다고 발표했고, 시사 주간지 《타임》은 이 시스템을 2011년을 빛낼 50대 발명 가운데 하나로 선정했다. 오리건주에서는 범죄인의 형량을 정하는 데에 이 시스템을 활용한다.[16] 마치 영화 〈마이너리티 리포트〉에 등장하는 예비 살인자 예측 시스템 프리크라임(pre-crime)이 현실화된 것처럼 보인다.

1995년 세계 최초로 DNA 데이터베이스를 도입한 영국은 전자 건강 기록을 법률의 일부로 포함하면서 개인의 생체 정보를 아무도 모르는 사이 상품화했다. DNA 데이터베이스 시스템을 극단적으로 지지하는 사람들은 뇌파계와 기능성 자기 공명 영상까지 써서 뇌 활동을 들여다보아야 한다고 주장한다. 시스템이 구축되면 잠재적 사이코패스, 테러리스트까지 찾아낼 수 있다는 이유에서다.[17]

하지만 이 과정에서도 인간의 편견과 의도가 개입되어 치명적인 결과를 낳을 수 있다. 범죄를 짓지 않은 사람들이 예비 범죄자로 분류될 수 있고 기본권 침해 문제도 일어날 수 있다. 데이터 과학 전문가인 캐시 오닐(Cathy O’Neil)은 프레드폴의 위험성을 지적한다. 프레드폴은 범죄 유형, 발생 장소와 시점이라는 핵심 데이터를 기반으로 한다. 이 시스템이 실제 범죄 현장에 적용될 때 경찰들에게 선택권이 주어진다. 경찰은 1군 범죄뿐만 아니라 경미한 2군 범죄에까지 공권력을 휘두를 수 있게 된다. 오닐은 미국의 가난한 동네에서 종종 일어나는 범죄는 사실 반사회적 행동이라고 부를 만큼 경미한 수준이라고 말한다. 만약 경찰이 지나치게 자의적인 판단을 내릴 경우 2군 범죄가 1군 범죄와 같은 중범죄로 왜곡될 가능성을 무시할 수 없다. 이렇게 적발된 정보는 프레드폴에 입력돼 데이터화되고 다시 경찰력의 증대로 이어진다. 오닐은 이런 데이터가 피해자 없는 범죄자들, 대부분 가난한 지역에 사는 흑인이나 히스패닉계를 교도소에 수감시키는 불합리한 결과로 이어진다고 지적한다. 부정적인 피드백 루프(feedback loop)를 활성화한다는 것이다.[18]

이미 중국에서는 반체제 인사나 양심수, 소수 민족에 대한 기본권 침해가 심각한 사회 문제로 대두되고 있다. 이들의 매우 사적인 부분, 의료 기록, 피임 방법, 슈퍼마켓 배달 기록 등이 중국 정부의 감시를 받아 수집되고 있다. 중국 정부는 수집된 정보들을 행동 방식 예측에 사용한다.[19]

빅데이터가 삶의 질을 개선하고 고양시킨다는 긍정적인 측면은 분명하다. 그러나 범죄를 사전에 차단할 수 있다는 이유만으로 인권 침해가 공공연하게 일어나는 것은 납득하기 어렵다. 그리고 이에 대한 인문학적 비판이 제기되지 않는다면, 빅데이터는 예비 범죄자를 향한 단죄라는 새로운 차별을 낳는 위험한 시스템으로 전락할 수도 있다.

의료 영역에서도 빅데이터에 대한 평가는 긍정적이다. 전문가들은 “의료 종사자 및 정책 입안자들은 빅데이터를 활용해 환자 개인 및 환자 치료에 대한 데이터베이스를 구축한다. 수집된 데이터는 전염병처럼 빠르게 전파되는 병원균에 신속하게 대응할 수 있게 해준다. 광범위한 의료 데이터의 집적으로 유전자 연구, 제약 연구도 더욱 활발하게 이뤄질 수 있다. 특히 진료 기록, 투약 및 부작용 정보, 예방 접종, 가족력 등이 개인의 전자 의료 기록에 포함되어 의료 기관끼리 정보를 효율적으로 공유할 수 있다”고 말한다.[20]

그러나 의료 영역에서 빅데이터 활용은 더욱 신중해야 한다. 중환자들의 생존 확률을 예측하는 프로그램 아파치-3, 인공지능 의사 왓슨(Watson)은 모든 병을 완벽하게 진단하지는 못한다. 기계가 잘못된 진단을 내릴 경우 발생하는 문제의 법적 책임 소재를 가리는 일도 쉽지 않다. 지금까지 인류가 질병, 고통에 대항하며 쌓아 온 가능성, 기적, 희망과 같은 가치들은 무용한 것으로 전락할 것이다. 그럼에도 생명과 존엄성의 문제는 의료비 손실 감소와 사회적 이익 증대라는 목적 앞에 가볍게 치부되고 만다. 인류 역사에서 의학의 발전을 추동한 요소 가운데 하나는 거대한 통계의 흐름이 보여 주는 규칙이 아니라 인간의 해석, 직관과 같은 예외들이었다. 경제적 시스템으로서의 빅데이터, 그리고 인간의 존엄과 가치를 보호하는 시스템으로서의 빅데이터를 함께 논의해야 한다.

 

데이터는 미래를 말하지 않는다


데이터의 수집, 해석과 분석을 거친 비즈니스 모델링, 예비 범죄 색출과 의료 영역에서의 활용. 빅데이터는 우리 삶을 바꾸어 놓을 획기적인 과학으로 다가온다. 그러나 이 지점에서 빅데이터에 대한 깊은 믿음을 되돌아볼 필요가 있다. 많은 것은 확실하고 의미 있는 것인가? 또 많은 것에서 도출한 해석이 가장 정확하고 가치 있는 해석인가?

데이터의 수집보다 중요한 것은 올바른 사용이고, 올바르게 사용하려면 비판적 해석과 인문학적 상상력이 필요하다. 이를 위해 끊임없이 질문을 던져야 한다. 빅데이터에 대한 맹신에 제동을 걸고 의미를 되살펴야 한다. 빅데이터는 인간처럼 생각하거나 성찰하지 않는다. “데이터 처리 과정은 과거를 코드화할 뿐 미래를 창조하지 않는다. 미래를 창조하려면 도덕적 상상력이 필요하다. 그런 능력은 오직 인간만이 지니고 있다. 우리는 더 나은 가치를 알고리즘에 명백히 포함시키고 우리의 윤리적 지표를 따르는 빅데이터 모형을 창조해야 한다. 그렇게 하려면 가끔은 이익보다 공정성을 우선시해야 한다”[21]는 캐시 오닐의 비판은 무겁게 다가온다.

빅데이터를 통해 분명히 알 수 있는 것은 과거와 현재일 뿐이다. 그것이 곧 미래에 대한 정확한 예측을 의미하지는 않는다. 빅데이터가 제시하는 방향성이 인류의 건강한 미래로 직결된다고 단언하기는 어렵다. 다수(big)의 흐름에 앞서 한 사람의 삶이라는 전제 위에서 데이터를 의심하고 비판해야 한다. 빅데이터가 창출한 가치에 환호하기에 앞서 그것이 과연 무엇을 위해 존재하는지 사유해 보아야 한다. 빅데이터가 가져다줄 이익을 계산하기 전에 프라이버시 침해, 조작과 오독, 존엄성과 생명의 문제라는 빅퀘스천을 던져야 한다.
[1]
이지영, 〈빅데이터〉, 《용어로 보는 IT - 네이버 지식백과》.
[2]
이지영, 〈빅데이터〉, 《용어로 보는 IT - 네이버 지식백과》.
[3]
정용찬, 《빅데이터》, 커뮤니케이션북스, 2013.
[4]
《뉴욕타임스》에 따르면, 데이터 업체 액시엄(Acxiom)만 해도 50조 개의 데이터 거래에 관여하고 있으며 거의 모든 거래는 개인으로부터 직접 수집하는 형태의 거래가 아니라고 한다. Fred H. Cate(손금주·이영조 譯), 〈빅데이터 활용에 있어서의 프라이버시 보호〉, 《서울대학교 경제규제와 법》, 22쪽, 2015.
[5]
크리스천 러더(이가영 譯), 《빅데이터 인간을 해석하다》, 다른, 175쪽, 2015.
[6]
정철환, 〈한국은 빅데이터 金鑛인데… 제대로 캐질 못해〉, 《조선비즈》, 2015. 10. 14.
[7]
차상육, 〈빅데이터(Big Data) 환경과 프라이버시의 보호〉, 《IT와 법연구》, 199쪽, 2014.
[8]
빅토어 마이어 쇤베르거·케네스 쿠키어(이지연 譯), 《빅데이터가 만드는 세상》, 21세기북스, 169쪽, 2013.
[9]
〈데이터 마이닝〉, 《두산백과》
[10]
윤상오, 〈빅데이터의 위험 유형 분류에 관한 연구〉, 《한국지역정보화학회지》, 108쪽, 2013. 
[11]
에릭 시겔(고한석 譯), 《빅데이터의 다음 단계는 예측 분석이다》, 이지스퍼블리싱, 29~36쪽, 2014.
[12]
박흥순, 〈규제 완화 vs 강화, 빅데이터 논란〉, 《머니S》, 2017. 9. 4.
[13]
임의로 설정한 지역의 빅데이터를 분석해 언제, 어떤 유형의 범죄가 몇 건 발생할지 예측하는 시스템.
[14]
정종오, 〈프리크라임(Pre-Crime)…현실화 된다〉, 《아시아경제》, 2015. 3. 12.
[16]
오리건 주는 지난 5년간 이 지역에서 범죄를 저지른 5만 5000명의 기록을 분석해 재범 위험성 예측 모델을 구축했다. 에릭 시겔(고한석 譯), 《빅데이터의 다음 단계는 예측 분석이다》, 이지스퍼블리싱, 107~108쪽, 124~125쪽, 2014.
[17]
힐러리 로즈, 스티븐 로즈(김명진, 김동광 譯), 《급진 과학으로 본 유전자 세포 뇌》, 바다출판사, 33~34쪽, 2015.
[18]
캐시 오닐(김정혜 譯), 《대량살상 수학무기》, 흐름출판, 151~152쪽, 2017.
[19]
김준영, 미국 프레드폴, 예비 범죄자 잡아내… 1년 새 강도 27% 줄어〉, 《중앙일보》, 2017. 12. 9.
[20]
김기환, 〈공공 부문 빅데이터의 활용성과 위험성〉, 《정책분석평가학회보》, 8~9쪽, 2013.
[21]
캐시 오닐(김정혜 譯), 《대량살상 수학무기》, 흐름출판, 337쪽, 2017.
다음 이야기가 궁금하신가요?
프라임 멤버가 되시고 모든 콘텐츠를 무제한 이용하세요.
프라임 가입하기
추천 콘텐츠
Close