구글 서치 글로브 - 무엇을 어떻게 보여 줄 것인가


구글이라는 기업은 참 재미있는 기업입니다. 기업이 하는 일, 미래를 내다보는 관점도 재미있지만 구글이 서비스하고 있는 것들 중에는 소위 경제성이 전혀 보이지 않는 것들도 많이 있습니다. "이게 돈이 되겠어?" 라고 의문을 던지게 만드는 것들 투성이인 기업이라고 할 수 있지요.



돈은 안 되지만 재미는 있는 서비스들이 많은 구글, 그 중에 하나가 바로 오늘 소개해 드릴 구글의 서치 글로브입니다.

바로가기 : 구글 서치글로브

참고로 웹 브라우저의 버전이 낮거나 3D 그래픽을 지원하지 않는 브라우저에서는 실행이 안 될 수도 있습니다. ( WebGL 이었나요. 자세한 기술은 잘 모르겠습니다. 만약 실행이 안되면 브라우저를 갈아타시는걸 권장합니다. +_+ )




구글은 기본적으로 검색엔진입니다. 자사의 데이터 베이스 안에 전세계의 수 많은 웹 페이지들의 정보들이 들어 있어, 검색을 원하는 사용자가 검색어를 입력하면 그 검색어와 가장 관련이 있을 법한 문서를 관련도 혹은 최신순으로 정렬해서 보여주는 역할을 하지요.

아마도 구글의 가장 큰 서비스이고 가장 기본이 되는 서비스가 바로 이 검색 서비스라는 것에는 이견이 없을 겁니다.

그렇다면 여기서 궁금한 것이 전세계 어느 곳에서 검색 요청이 이루어지고 있으며 어느 도시에거 가장 많이 발생할까요? 즉, 국가별로 구글을 사용하는 빈도, 도시별로 구글을 사용하는 빈도를 알아 볼 수 있다면 재밌겠지요. 그래서 나온 서비스가 구글 서치 글로브입니다.




위에 제가 걸어 놓은 링크를 따라가 보시면 위와 같은 지구본 모양이 나오게 됩니다. 지구본은 지구본인데 고슴도치처럼 뭐가 뾰족뾰족 튀어 나와있지요? 바로 구글 검색엔진에 날아오는 검색 요청들의 빈도수를 하루에 한번씩 계산해서 시각화 해 놓은 것입니다.

좀 더 자세 설명을 하자면,

- 튀어나온 막대기의 길이는 그 지역의 검색 횟수입니다.
- 막대기의 색은 언어의 종류입니다.

좀 더 자세한 내용은 구글의 공식 블로그에 가보시면 잘 설명이 되어 있습니다. ( 단, 영어라는거... )



이 지구본에서 흥미로운 것은 바로 아프리카 부분입니다. 전세계의 여러 나라에서 활발하게 구글로의 검색 요청이 들어오고 있는 가운데 아프리카 지역은 검은 색을 유지하고 있습니다. 문명의 전파가 아직 활발히 되지 않은 곳이라는 증거가 되겠네요. 인터넷이 계속 성장해서 아프리카 부분에도 밝은 색의 점들로 가득하기를 바란다는 구글의 메시지도 있었습니다.


The FlickrVerse, April 2005 poster: flickr's social network
The FlickrVerse, April 2005 poster: flickr's social network by GustavoG moved to http://23hq.com/GustavoG 저작자 표시비영리동일조건 변경허락



▶ 이제는 어떻게 보여줄 것인가도 중요

21세기, 우리 주변에는 엄청난 수의 디지털 기기들이 있습니다. 그와 더불어 더 많은 수의 센서들이 있습니다. 이 센서들은 매초, 혹은 매 밀리초마다 데이터를 생산해내게 됩니다. 기상청이 설치해 놓은 기상관련 센서들은 계속해서 기상관련 데이터들을 수집하고 있으며, 구글의 경우에도 사용자가 어떤 요청을 했는지에 대한 어마어마한 양의 데이터를 가지고 있으며 그 데이터들은 매순간 엄청난 양으로 불어나고 있습니다.

이러한 데이터의 홍수에 빠져 있는 가운데, 중요해지고 있는 것이 데이터의 요약 기술입니다. 수 많은 데이터에서 의미있는 정보를 뽑아내기 위해서는 데이터의 요약이 필요한 경우가 있습니다. 예를 들어, 전 세계에 퍼져있는 기온 관측 센서에서 기온을 수집하여 해당 지역의 평균 기온을 계산해 낼 수 있지요.

binary easter egg
binary easter egg by Rakka 저작자 표시비영리변경 금지


하지만 이렇게 요약을 해서 데이터를 정리한다고 해도 인간의 두뇌는 선천적으로 숫자와 친하지 않은 모양입니다. 말로 설명을 하면 쉽게 알아 들을 것도 숫자로 써 놓으면 헷갈릴 때가 있습니다.

이럴때 필요한 기술이 시각화 기술입니다. 구글 서치글로브의 예에서도 단순히 국가의 이름과 검색 횟수를 정리한 표 형태의 데이터를 보여줬다면 공감하기 힘들고 분석하기도 힘들었겠죠.

하지만 그런 데이터 들을 지구본과 연결시켜 이해하기 쉽고 보기 좋게 시각화 하여 보는이로 하여금 이해하는데 필요한 노력을 줄여 줄 수 있습니다. 지구 온난화의 경우 수온 데이터를 그냥 숫자로 표현하는것 보다 높은 온도를 빨간색으로, 낮은 온도를 파란색으로 색칠한 지도 형태로 보여주는게 이해가 더 빠르지요.

What It Feels Like for an Uncle
What It Feels Like for an Uncle by qthomasbower 저작자 표시동일조건 변경허락



앞으로 수집되는 데이터 양이 갈 수록 더 많아 집니다. 이러한 가운데 데이터의 시각화 기술이 더 중요해지고 있는 것입니다. ^^



 컴퓨터를 접하는 우리는 항상 데이터를 다루고 있습니다. 하지만 데이터란 무엇일까요? 세상에서 가장 어려운 질문이 정의를 물어보는 것이 아닌가합니다. 막연히 데이터라는 말을 사용하고 있지만 정작 데이터의 정확한 정의는 알고 있지 않습니다. ( 물론 컴퓨터 공학 전공이신 분들은 명쾌한 정의를 다 알고 계실 겁니다. )

Information Superhighway
Information Superhighway by nickwheeleroz 저작자 표시비영리동일조건 변경허락

 데이터는
The term data means groups of information that represent the qualitative or quantitative attributes of a variable or set of variables.
라고 위키피디아는 정의합니다. 한글로 쉽게 풀어 쓰면, 데이터는 사실을 나타내는 수치라고 할 수 있습니다. 예를 들면, 오늘의 날씨 정보에서 오늘 아침 기온, 습도, 날씨 등등 각각의 수치들은 데이터가 됩니다.

Actual is not normal (a tribute to Edward Tufte) by kevindooley 저작자 표시

 하지만 데이터 자체로는 큰 의미가 없습니다. 컴퓨터 공학에서는 데이터를 가공( 처리 : Processing )하여 정보를 만듭니다. 예를 들면 날씨를 나타내는 데이터들 ( 기온, 습도, 풍속, 위성사진 등 )은 기상대나 백엽상 등에서 측정 장비로 관측됩니다. 이 데이터는 그저 사실을 나타 낼 뿐이죠. 이제 이 데이터들을 처리하여 정보를 만듭니다. 기상대에서 측정 된 각각의 데이터들을 바탕으로 내일의 날씨를 예보하게 되죠.
 
Extinct Poster
Extinct Poster by Network Osaka 저작자 표시비영리변경 금지

 데이터를 처리하여 나온 결과를 "정보"라고 하는데, 정보란 간략하게 정의하자면 "사용자의 의사결정에 도움이 될 만한 잘 정리 된 데이터들." 이라고 할 수 있습니다. 현실 세계에서 보자면 구름 사진( 데이터 )이 지구과학 교과서에 사용되어 교육용으로 이용( 정보 ) 될 수도 있고, 사진 작품전에 출품( 정보 ) 될 수도 있습니다.

 컴퓨터는 이런 데이터를 입력 받아서 정보로 만들어 주는 역할을 하는 기계라고 할 수 있습니다.


-- 요약 --
 데이터는 그냥 사실을 나타내는 수치일 뿐이고, 정보는 사용자의 의사결정에 도움을 주는 가공 된 데이터들의 집합이다.


+ Recent posts