디지털 시대에서 데이터는 흔히 원유에 비견된다.
원유를 정제해 휘발유, 페인트, 옷 등 다양한 석유 제품을 만들듯이, 4차 산업혁명 시대는 데이터를 기반으로 작동한다.
데이터를 어떻게 분석하고 활용할 것인지에 따라 산업은 물론 조직과 개인의 경쟁력을 좌우하는 핵심 요소가 된다.
지금, 우리가 데이터에 주목해야 하는 이유다.
글 구보은 • 참고도서 「데이톨로지」 (김성태, 이른비)
데이터를 어떻게 다룰 것인가
우리는 매일 데이터를 생산하며 살아간다. 스마트폰 하나만 있어도 내비게이션으로 길을 찾고 SNS에 글을 남기고 온라인쇼핑을 한다. 이러한 우리의 일상생활은 자동차 동선, 신용카드 소비 목록, 통신 내역, 별점 평가까지 실시간으로 데이터가 된다.
데이터data란 주어진 것이라는 뜻의 라틴어 ‘다툼’datum에서 온 말이다. 숫자와 문자부터 기호, 사진, 표, 음성, 영상 등 다양한 요소로 구성되는데, 데이터에 의미를 부여하면 정보가 된다. 즉, 데이터는 넓은 의미에서 정보가 포함된 자료라 할 수 있다.
150여 년 전 미국, 해군이었던 매슈 모리는 불의의 사고로 장애를 입고 해도측기창(지금의 해군해양부)에서 일하게 된다. 그리고 우연히 창고에서 방치되어 있던 방대한 문서와 자료들을 발견하는데, 이는 선박들이 항해 후에 남긴 기록이었다. 그는 항해 노선, 시기별 항해 기상, 해류, 해저 암초의 위치, 과거 선박 사고 등 50만 건 이상의 자료를 분류하고 분석했다. 그리고 수년의 노력 끝에 1847년 대서양의 풍향 풍속과 해류의 흐름을 담은 항해도를 펴냈다. 항해도로 인해 항해 시간이 단축되고 해양 사고가 줄어들게 되었다.
이처럼 데이터 분석은 데이터에 들어 있는 정보를 찾고 그 안에서 새로운 가치를 발견하는 것을 말한다. 매슈 모리의 항해도는 목적에 맞는 자료 수집, 분류 분석, 새로운 결과 도출, 다시 의미 있는 데이터로 통합되는 과정을 잘 보여주는 사례라 할 수 있다.
빅데이터가 만드는 세상
빅데이터big data는 지난 2011년 세계적인 컨설팅 기관인 매켄지에서 발행한 동명의 보고서로 처음 주목을 받았다. 이듬해 다보스 세계경제포럼에서 올해 가장 주목해야 할 과학기술로 선정되면서 디지털 시대의 화두로 자리 잡았다.
디지털 기기와 플랫폼이 발전함에 따라 데이터의 양이 증가하고 그 형태도 다양해졌다. 초기 디지털 데이터는 주로 숫자와 문서였다. 인터넷과 디지털카메라를 사용하면서 사진과 오디오, 웹 데이터가 생성되었고 현재는 스마트폰을 통해 모바일 데이터가 쏟아지고 있다. 세상에 있는 모든 데이터 가운데 약 90%가 2015년 이후 생산되었다고 한다. 데이터 증가속도는 시간이 지날수록 더욱 빨라질 것으로 전망된다.
빅데이터는 이미 산업은 물론 의료, 보건, 교육, 환경 등 다양한 분야에서 그 가치를 입증했다. 구글은 지난 2009년부터 검색 기록을 분석해 세계보건기구보다 앞서 독감과 신종플루 예측 지역을 알려주는 감기 지도 서비스를 제공하고 있다. 볼보는 정보 수집 장치가 부착된 자사 고객들의 운전 정보를 바탕으로 교통 서비스를 제공하거나 사고 위험을 경고하고 있다.
아마존은 회원들의 구매 내역에 따른 맞춤형 알림 서비스를 제공해 매출에서 큰 효과를 거두고 있다. 이제 세계적 기업들에게 빅데이터의 활용은 선택의 문제가 아니라 생존 경쟁에서 살아남기 위한 필수적인 전략이 되었다. 분명한 것은 빅데이터는 미래를 여는 다양한 기술의 원천재료라는 사실이다.
데이터텔링과 인포그래픽
우리는 정보의 홍수 속에서 살고 있다. 정보가 넘쳐나다 보니 눈에 확 띄는 콘텐츠에 쉽게 손이 간다. 정보의 내용도 중요하지만, 정보를 전달하는 방식이 더 중요해진 것이다. 기존의 정보 전달은 주로 문자 위주로 이루어졌으나, 이제 사람들은 이미지와 영상으로 만든 시각적 정보를 더 선호한다. 실제 뉴스 보도에서도 기사의 문장이 점점 짧아지고 카드뉴스 같은 이미지 사용이 늘어나는 추세다.
이제는 전통적인 문자 기반의 스토리텔링 기술이 아니라, 이미지를 이용한 데이터텔링 기술이 필요한 시대다. 정보information와 그래픽graphics의 합성어인 인포그래픽infographics은 데이터를 시각적 디자인으로 표현하는 대표적인 기술로, 일러스트, 사진, 도형, 그래프, 표 등을 활용해 정보를 이해하기 쉽고 설득력 있게 전달한다. 컴퓨터 그래픽 기술이 발달하며 생긴 개념이지만, 한 컷의 이미지에 메시지를 담는 방식은 이미 역사가 깊다.
19세기 영국을 중심으로 콜레라가 유행하면서 30여 년간 수많은 사람이 죽어갔다. 당시에는 열악한 환경으로 인한 더러운 공기가 콜레라의 원인이라고 여겨졌다. 그러다 1854년 영국 소호 지역에 대규모 콜레라가 발생하자, 의사인 존 스노는 이 지역의 콜레라 상황을 한눈에 알 수 있는 감염 지도를 작성했다.
그리고 물 펌프에 가까울수록 사망자가 더 많다는 놀라운 사실을 발견했다. 콜레라 발생 위치를 그리면서 전염병의 원인이 공기가 아닌 식수원의 오염이었다는 사실을 밝혀낸 것이다. 이처럼 데이터텔링에서 중요한 것은 목적에 따라 데이터를 이미지로 표현하고, 때로는 그 자체가 하나의 메시지로 가치를 드러낼 수 있어야 한다는 점이다.
딥러닝을 넘어 딥필링을 향해
인공지능을 이야기할 때 빼놓을 수 없는 것이 딥러닝 기술이다. 딥러닝deep learning이란 컴퓨터가 스스로 외부 데이터를 조합·분석하여 학습하는 기술로, 인간의 정보 처리 메커니즘을 그대로 인공지능에 적용한 것이다. 우리 뇌에는 정보가 입력되는 입력층과 정보를 처리하는 중간층, 마지막으로 결과를 내보내는 출력층이 있다. 우리가 어떤 일에 대한 결론을 내릴 때 여러 상황을 고민하듯이, 인공지능도 중간층에 더 많은 데이터와 학습 과정이 쌓이면 지능과 문제 해결 능력이 높아진다. 인공지능이 인간처럼 생각할 수 있는 지능을 갖기 시작한 것이다.
그렇다면 인간의 감정은 어떨까. 최근 테슬라를 비롯한 글로벌 자동차 기업들이 앞다투어 인공지능 기능이 탑재된 자율주행차를 출시하고 있다. 감정인식 차량제어나 운전자 상태 모니터링 등 탑승자가 최대한 편안함을 느끼도록 감정을 읽는 인공지능 시스템을 도입한 것이다. 이른바 딥필링deep feeling 기술이다.
딥필링은 인간의 복잡한 내면세계와 다양한 외부 환경이 상호 작용하며 만들어내는 감정 체계를 스스로 인지하고 구현해가는 과정이다. 인간의 감정이라는 복잡한 세계를 기계 시스템이 완전히 대체하기는 어려울지 모른다. 그럼에도 인공지능 기술은 딥러닝을 넘어 딥필링으로 나아가고 있다.
데이터는 이처럼 고도의 컴퓨터 정보처리 기술과 결합하며 새로운 미래사회를 만들어가고 있다. 미래사회에 대한 다양한 예측들 속에서 지나친 기대와 두려움보다는, 데이터를 통해 세상을 읽고 이해하는 공부가 필요한 시점이다.