드디어 오랜 귀차니즘을 깨고 트위터(Twitter) 에 가입을 하기로 했습니다. 저 처럼 귀차니즘과 새로운 서비스에 대한 두려움 (?)으로 진입을 못 하는 분들께 설명을 드리고자 가입 방법과 간단한 설명을 올리겠습니다. 요즘 정치인들이나 연예인들이 자기 트위터로 팬들과 대화를 하면서 트위터는 소통의 대명사로 국내에 알려지고 있습니다.

 트위터는 모바일 디바이스와 결합해서 더더욱 성장 할 것 같으니 자기 계장 하나쯤은 갖고 있어 보자구요. ^^


트위터(Twitter)란?

  도대체 트위터가 뭐길래 세상 사람들이 이렇게 난리일까요? 트위터는 기존에 한국에서 서비스 하던 싸이월드의 미니홈피와 블로그와 비슷한 SNS( Social Network Service )로 미니홈피처럼 특정 인맥이 존재하고 있어서 인맥 안의 사람들끼리 어떤 주제를 가지고 이야기를 하는 초소형 블로그 서비스입니다. 초소형 블로그라고 하는 이유는 기능이 블로그와 비슷하기 때문입니다. 초소형이라는 단어는 140자 이하의 글자수로 제한을 두어서 전문적이기 보다는 소소한 일상을 이야기하는 정말 작은 블로그 ( Micro Blog ) 와 비슷하기 때문에 그렇게 명명하였습니다.

 싸이월드의 미니홈피와 다른 점은 싸이월드의 경우엔 1촌이라는 폐쇄적인 네트워크 내에서 모든 메시지와 정보들이 돌게 되지만 트위터는 1촌이 아니어도 관심이 있는 사람의 트위터를 팔로잉( Following ) 하여 그 사람이 트위터로 말하는 모든 내용을 전
트위터

트위터(twitter) : 재잘 거리다

해 들을 수 있습니다.

 트위터가 이 처럼 선풍적인 인기를 끌게 된 원인은 여러가지인데 트위터의 특징 및 장단점은 나중에 포스팅을 하도록 하고 간단한 특징을 몇 가지 소개해 드리겠습니다. 트위터는 140자 이하의 단문 메시지로 이루어져 있습니다. 따라서 문장의 길이에 제한이 없는 블로그보다는 훨씬 가볍기 때문에 정보의 이동 속도가 굉장히 빠릅니다. 특히 모바일 디바이스와 쉽게 연동이 되어서 특정 사건이 발생했을 때, 그 전파 속도가 뉴스보다도 빠르다고 알려져 있습니다.

 실로 아이티 지진때 지진이 일어났다는 소식이 뉴스에 의해서 전파된 것보다 트위터에 의해서 전파된 속도가 훨씬 빨랐다고 합니다. 이를 보면 이젠 트위터를 무시 할 수 없는 단계까지 진화를 했음을 볼 수 있습니다. ( 그니까 가입 하죠 ^^ )

 적절한 비유를 들어보면 기존의 블로그가 웹진( 인터넷으로 발행되는 잡지 )이나 이메일이라고 한다면, 트위터(Twitter)는 문자메시지나 메신저에 해당 된다고 보시면 됩니다.



트위터(Twitter) 가입 하기

그럼 전 세계의 유명인사들이 사용하고 있고 소통하고 있는 트위터에 가입을 해보겠습니다. 트위터 홈페이지 (http://twitter.com/)에 접속을 합니다.

 ※ 참 트위터는 외국에서 제공하는 서비스이기 때문에 영어로 이루어져 있습니다. 하지만 영어 울렁증이 있으신 분들도 꺼리지 않을 만큼 쉬운 영어로 되어 있습니다. 또 이 포스팅을 따라하시면 어렵지 않게 트위터 계정을 만들 수 있습니다.


트위터 가입하기 1

트위터 가입하기 1



트위터의 메인 페이지는 위 그림과 같이 생겼습니다.
1번 박스에 보이는 정보들은 유명 인사들의 트위터입니다. 중간에 빌게이츠도 보이는 군요. 유명 인사들의 트위터를 구독하는 것도 재미있는 일입니다.
2번 박스에는 현재 인기도가 급상승하고 있는 트위터들을 나열해주는 것 같습니다. 현재 트렌드를 알아볼 수 있는 좋은 기회입니다.
3번 박스는 트위터에 가입 할 수 있는 창으로 넘어 갈 수 있는 버튼이 있습니다. "Get Started Now" 버튼을 누르면 가입을 할 수 있습니다.
 이제 번호에 따라서 실행을 하면 트위터에 가입이 됩니다. ^^

1. [Get Started Now] 버튼을 눌러서 다음 단계로 넘어갑니다.

트위터 가입하기 2

트위터 가입하기 2



2. 필요한 정보들을 입력합니다. 회원가입을 하는데 주민등록번호를 쓰지 않아도 되는 것이 편리하네요. 각 입력 폼은 다음과 같습니다.

  1) 여러분의 이름 전부를 입력합니다. 예를 들어 홍길동이라면 (Hong Gil-dong) 을 입력하시면 됩니다.
  2) 아이디를 입력합니다. 여러분이 선호하는 아이디를 입력하시면 이미 존재하는 아이디인지 여부를 검사하게 됩니다.
      이미 존재하는 아이디라면 다시 만들어야 합니다.
  3) 사용할 비밀번호를 입력합니다. 비밀번호 확인란이 없네요. 실수 하지 않게 주의하세요.
  4) 이메일을 입력합니다. 여기에 입력한 이메일 주소로 본인 인증 메일이 보내지게 됩니다.
  5) 사용 약관. 트위터와 관련된 사용 약관입니다. 영어 공부도 할 겸 한번씩 읽어보세요 .^^
  6) 확인 버튼. 입력 폼에 적절한 정보를 입력하셨으면 [Create my account] 버튼을 눌러서 다음으로 넘어갑니다.


트위터 가입하기 3

트위터 가입하기 4


3. 자동 가입 봇에 의한 자동가입을 막기 위해서 "사람인지 확인 하는 작업"을 실시합니다. 간혹 사람이 알아보기 힘든 확인 글자들이 나오는데 그럴땐 이 창을 닫았다가 버튼을 다시 클릭하면 됩니다. ( 엑박이 뜨는 경우도 있고 ㅋㅋㅋ )

트위터 가입하기 4

트위터 가입하기 4


4. 다음 뜨는 화면은 시작하면서 "follow" 라는 기능을 소개 해 주면서 여러분이 관심 있어 하는 분야를 선택하면 해당 주제에 대한 트위터들을 보여주는 화면입니다. 왼쪽에 보이는 카테고리를 클릭하면 ..

트위터 Following

트위터 Following


 위와 같은 화면이 나오면서 [follow] 버튼이 생깁니다. 관심 있는 사람이 있으면 클릭하셔도 되지만 귀찮으니 그냥 밑에 있는 [Next step : friends]를 클릭해서 다음 단계로 넘어가도록 하겠습니다.

트위터 가입하기 5

트위터 가입하기 5


 5. 다음으로 여러분의 친구를 찾는 기능이 있습니다. 아까 입력했던 이메일 주소가 Gmail 이거나 야후 메일이거나 AOL 메일이라면 친구 목록을 이용해서 이미 가입되어 있는 여러분의 친구들을 follow 할 수 있는 기능인가 봅니다. 저는 왼쪽에 있는 메일들을 사용하지 않기 때문에 그냥 패스하도록 하겠습니다. 
 [Next Step] 버튼을 클릭합니다.

트위터 가입하기 6

트위터 가입하기 6


 6. 마지막으로 여러분이 관심을 갖을 수 있는 사람들을 검색 할 수 있습니다. 예를 들어 "Jobs" 라는 단어로 검색을 하면 스티브 잡스의 트위터를 볼 수가 있습니다. Jobs로 검색을 해보겠습니다.

스티브 잡스를 Following 하라

스티브 잡스를 Following 하라



 저 트위터가 맞는지는 모르겠지만 스티브 잡스의 것으로 보이는 트위터가 있네요. [follow]버튼을 눌러서 스티브 잡스의 트위터를 팔로우 해보도록 하겠습니다. [follow] 버튼을 누르면 위 붉은 색 박스가 다음과 같이 변하게 됩니다.

스티브 잡스를 Following 하라

스티브 잡스를 Following 하라


 [Next Step:you're done] 버튼을 누릅니다.


트위터 : 확인 요망

트위터 : 확인 요망


7. 이제 메인 화면으로 넘어갔습니다. 빨간색 박스를 보시면 여러분이 아까 입력했던 메일 주소로 확인 메일이 보내졌다는 것을 알 수 있습니다.

트위터 : 확인 메일

트위터 : 확인 메일


8. 아까 입력한 메일에 들어가보면 위와 같은 메일이 와있을 겁니다. 링크가 하나 걸려있는데 링크를 클릭하시면,

트위터 : 확인 완료

트위터 : 확인 완료


 감사하다는 메시지가 뜹니다. 이제 여러분의 트위터 계정이 만들어 졌습니다. 참 쉽죠잉~~
 트위터 가입을 하면서 느끼는 점이 가입 과정이 굉장히 쉽다는 것입니다. 우리나라의 경우에는 가입하려고 하면 본인 확인을 위해서 주민등록번호는 물론이고 핸드폰 SMS 확인 인증까지 받아야 합니다. 그렇기 때문에 새로 어떤 서비스를 가입할 때 번거로운 점이 많이 있는데요. 트위터의 경우에는 번거로움이 거의 없었습니다.

 이제 여러분도 트위터 계정 하나 갖게 되었습니다. ^^ 시대에 뒤떨어지지 말자구요. ㅎㅎ




 이클립스와 톰캣을 연동하여 사용 할 때, 자주 나타나는 메시지가 톰캣이 사용하는 포트가 충돌한다는 메시지 입니다.


이 창이 자주 뜨게 되는데요.

'Starting Tomcat v5.5  Server at localhost' has encounterd a problem.

Server ports (8080, 8009) required by Tomcat v5.5 Server at localhost are already in use. The server may already be running in another process, or a system process may be using the port. To start this server you will need to stop the other process or change the port number(s).

라는 메시지가 뜹니다. 해석을 해보자면, Tomcat 이 사용하는 8080, 8009 포트가 이미 사용중이라는 말입니다. 서버가 이미 실행되고 있을 수 있으니 확인해 보시라는 경고 메시지입니다. 이클립스에서 JSP 실행을 하기 위해서 기존에 실행 하던 서버를 잠시 정지 시키는 것을 요구하고 있네요.

해결 방법으로는 기존에 실행되고 있는 톰캣 서버나 다른 서버 프로그램을 잠시 정지 시키거나 중지 시키고 실행을 하면 됩니다.


해결 방법 1

 기존에 실행이 되고 있는 톰캐 서버를 정지해보겠습니다.
 여러분의 컴퓨터 트레이를 보시면


이렇게 생긴 아이콘이 있을 텐데요. ( 없을 수도 있습니다. )
이 아이콘을 우클릭하여


'Stop service' 를 누릅니다.
그리고 이클립스로 돌아가서 실행을 하면, 오류 없이 실행 될 겁니다.
그리고 테스트가 끝난 다음 다시 'Start service' 를 눌러서 실행 시켜 주면 됩니다.
근데, 개인 PC에서 실습 이외에 톰캣 서버를 돌릴 이유가 있나 싶네요.


해결 방법 2

  트레이에 저 아이콘이 없는 경우엔 작업 관리자를 열어서 톰캣 서버 프로그램을 강제로 꺼주는 방법을 쓰면 됩니다.
  작업 관리자를 실행한 후 "프로세스" 탭을 보시면


tomcatXX.exe 라고 하는 톰캣 프로세스가 실행되고 있을 겁니다.
톰캣 서버를 담당하는 프로세스인데요.
이 프로세스를 종료해 줍니다



프로세스 끝내기를 눌러서 종료를 해주시고,
이클립스에서 다시 소스 코드를 실행하시면 잘 동작 할 것입니다.

JSP 환경 구축하면서 처음 보게 된 오류 메시지였는데, 별로 어렵지 않게 해결이 되네요 ㅎㅎ


JSP 학습 추천 도서


JSP 프로그래밍의 시작


  이전 포스팅에서 JSP 프로그래밍을 할 수 있는 환경을 구축 하였습니다. 만약 여러분의 컴퓨터에 JSP를 프로그래밍 할 수 있는 환경이 갖추어 지지 않았다면, 이전 포스트를 보면서 JSP 환경 구축을 하시기 바랍니다. 프로그래밍 환경이 구축되지 않았다면 JSP 프로그래밍 하기 힘들어요~ ( 메모장을 이용해서 서버에 올리는 식으로 할 수도 있지만 시간이 많이 걸리고 복잡해서 처음 배우는 분들에겐 비추입니다. )

2010/04/06 - [컴퓨터 공학/Java] - 자바( Java )설치하기 & 환경변수( path ) 설정하기
2010/04/06 - [컴퓨터 공학/Java] - 자바( JAVA ) 개발 환경 설치( IDE 설치 ) - 이클립스( Eclipse ) 설치하기 및 오류
2010/07/15 - [컴퓨터 공학/Java] - 이클립스와 톰캣 설치 및 연동하기


이클립스 프로젝트 생성하기

 그러면 JSP 프로그래밍을 하기위해서 개발환경인 이클립스를 실행시킵니다.


이클립스에도 여러가지 버젼이 있는데, 저는 갈릴레오 버전을 사용하고 있습니다. 갈릴레오 버전이 나온지 얼마 안되서 아직 호환성 문제 및 여러가지 잡음이 있는데, 만약 JSP 프로그래밍을 하다가 안 되는 점이 있으면, 잘 찾아 보시고 정 안되면 이전 버전인 유로파 같은 버전을 다시 설치해 주시기 바랍니다.

 
어짜피 이클립스는 인스톨 과정이 없고, 그냥 압축 파일만 압축 해제 해주면 되기 때문에 다운그레이드 하는 과정이 굉장히 쉽습니다.

하위 버전을 사용 하실 경우 톰캣 연동 플러그인을 다시 설치해 주셔야 합니다. ( plugins 폴더에 다시 집어 넣어 주셔야 합니다. )

2010/07/15 - [컴퓨터 공학/Java] - 이클립스와 톰캣 설치 및 연동하기


이클립스를 실행 하셨으면, [File] -> [New] -> [Project]를 선택합니다.



 Project 를 새로 생성 할 수 있는 창이 뜨는데요. 이 메뉴 중에서 'Web' 의 하위메뉴에서 'Dynamic Web Project'를 선택해 줍니다.

여기서 Dynamic Web Project 란 동적인 웹 페이지를 만들 수 있는 프로젝트를 말합니다. 동적인 웹 페이지란, 게시판 처럼 데이터 베이스나 어떤 입력, 조건 등에 따라서 웹 페이지의 내용이 동적으로 변하는 페이지를 말합니다. JSP나 PHP, ASP 등의 웹 프로그래밍 언어로 쓰여진 웹 페이지가 이런 동적 웹페이지 ( Dynamic Web Page )에 해당합니다.

 반면 Static Web Project는 JSP 같은 웹 프로그래밍 언어가 아니라 단지 HTML과 Javascript, css와 같은 웹 페이지 자체의 동적인 요소가 없는 페이지를 만드는 프로젝트를 의미합니다.

 우리는 JSP 프로그래밍을 할 것이기 때문에 'Dynamic Web Project'를 선택합니다.




'Dynamic Web Project'를 선택 하셨으면 위와 같은 창이 나올 겁니다. 'Project Name'에 적절한 프로젝트 이름을 써줍니다. 나머지는 그냥 기본 설정을 따라가시면 됩니다.


그 밑에 'Project contents' 는 프로젝트의 컨텐츠 ( 설정사항, 소스 코드 등 ) 들이 어느 디렉토리에 저장이 될 것인가를 말합니다. 기본으로 설정을 하면, 여러분의 'Work Space' 에 저장이 될 겁니다.
그리고 'Target Runtime'은 개발한 JSP 등의 실행을 위한 서버를 설정하는 곳인데, 나중에 설정을 하게 될 것이니 <None>을 사용하도록 합니다.


프로젝트 이름을 입력 하셨으면, [Finish] 를 눌러서 진행합니다.




프로젝트가 생성되어 'Project Explorer'에 방금 생성한 프로젝트가 등록이 되어 있는 것을 볼 수 있습니다.
저는 'JspProgramming' 이라는 이름으로 생성을 했습니다. 여러분도 여러분이 써 넣으신 프로젝트 이름이 저 곳에 뜰 겁니다.


"Hello, world!" 프로그램 소스 작성

이제 JSP를 프로그래밍 할 수 있는 프로젝트까지 생성이 되었습니다.
지금부터는 실제로 JSP 프로그래밍을 해보도록 하겠습니다. 프로그래밍을 배울 때, 가장 먼저 작성하는 프로그래밍이 바로 Hello, World 인데요. 간단하기 "Hello, World!"라는 문자를 출력하는 프로그램 입니다.




Project Explorer에 보시면 'WebContent' 라는 폴더가 있습니다. 이 폴더를 선택하고 우클릭해서 폴더를 하나 만들어 줍니다.
[우클릭] -> [New] -> [Folder] 를 선택합니다.




폴더 이름에 적절한 이름을 넣어줍니다.
저는 HelloWorld 라는 이름을 넣었습니다.
적절한 이름을 넣고 [Finish]를 선택합니다.

뭐, 사실 이렇게 폴더를 만들어서 관리를 하지 않아도 됩니다만 효과적인 소스 관리를 위해서 저는 폴더를 만들어서 관리를 하는 편입니다. 나중에 프로젝트가 커지거나 소스 파일이 많아지면 헷갈리게 되거든요 ^^

귀찮으신 분들은 폴더 안 만드셔도 됩니다.




HelloWorld 라는 폴더가 생성이 되었으면 ( 여러분이 입력한 폴더가 생성이 되었으면 ) 그 폴더를 선택하고 [우클릭] -> [New] -> [JSP]를 선택합니다.

만약 JSP가 보이지 않으신다면,

[New] -> [Other] -> 'Web' -> 'JSP' 를 선택하시기 바랍니다.







 "File Name" 에 생성할 파일이름을 써 넣습니다.
 저는 "HelloWorld.jsp"를 써 넣겠습니다.
 [Finish] 를 눌러도 되지만 [Next]를 눌러서 템플릿 소스를 선택하도록 하겠습니다.



여러가지 템플릿 항목들이 있는데, 그 중에 "New JSP File (html)" 을 선택하고 [Finish] 버튼을 누르겠습니다.

템플릿이란?

프로그래밍을 하게 되면, 기본적인 구조를 계속해서 입력해야 할 상황이 있습니다.

HTML을 예로 들면,
<html>
<head>
<title></title>
</head>
<body>
</body>
</html>

이 부분은 새로운 html 페이지를 만들 때 항상 반복적으로 써 넣어야 합니다. 하지만 템플릿을 사용하면 이런 기본적인 구조가 미리 쓰여진채로 생성이 되어서 보다 편리하게 프로그래밍을 할 수 있습니다.

물론 Ctrl + C,V 를 해서 복사를 할 수도 있지만 이 기능을 사용하는게 더  깔끔하고 멋지지 않을 까요? ㅋㅋ

그럼 "Hello, World!"를 출력하는 프로그램을 작성해 보도록 하겠습니다.

<%@ page language="java" contentType="text/html; charset=EUC-KR"
    pageEncoding="EUC-KR"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=EUC-KR">
<title>Insert title here</title>
</head>
<body>
Hello, World!
</body>
</html>

단순히 템플릿에 의해 생성된 내용 중에 '<body>' 와 '</body>' 사이에 "Hello, World!" 만 타이핑 해서 넣은 화면입니다. 템플릿을 이용하면 편리하긴 하지만 좀 더럽게 느껴질 수도 있습니다. 생략 할 수도 있는 것들이 추가 되니까 말이죠.

[Ctrl] + [F11] 을 눌러서 실행을 시킵니다.


위와 같은 창이 뜨는데, 아마 'IBM WebSphere v6.0' 이라는 항목이 기본으로 설정되어 있을 텐데, 조금 위로 올라가면
'Apache' -> 'Tomcat v5.5 Server' 가 있을 겁니다. 여기서 여러분이 설치한 톰캣 서버의 버전을 선택해 주시면 됩니다. 저는 5.5 버전을 설치했으니 v5.5 를 선택하겠습니다.


'Tomcat Installation directory'의 [Browse]를 클릭해서 여러분이 이전에 톰캣 서버를 설치한 디렉토리를 지정해 줍니다.
기본 디렉토리는 "C:\Program Files\Apache Software Foundation\Tomcat 5.5" 입니다.
[Next]를 눌러서 진행합니다.


다음은 실행에 포함시킬 프로젝트를 선택하는 화면입니다.
'Project" Explorer' 에 여러개의 프로젝트를 포함 시킬 수 있는데, 그 중에 실행 시킬 프로젝트를 고르는 화면입니다. Configured 라는 쪽이 실행 시킬 프로젝트 목록이고, Available 이라는 쪽이 추가 시킬 수 있는 프로젝트입니다. 여러개의 프로젝트가 연계해서 작동하는 큰 프로젝트가 아니면 대부분 현재 실행되고 있는 프로젝트만 포함 시킵니다.

이렇게 서버 설정이 끝나고, 다시 [Ctrl] + [F11] 을 눌러서 프로젝트를 실행 시킵니다.



자, Hello, World! 라는 문자열이 뜬 것이 보입니다.
이제 JSP 프로그래밍을 할 수 있는 개발 환경과 간단한 JSP 프로그래밍을 해 봤는데요. 앞으로 배울 것이 더 많고 많이 배울 수록 해보고 싶은 것들이 더 많게 될 것입니다.

JSP 학습 추천 도서





1. 데이터 마이닝이란 무엇인가?

 1990년대 중반부터 데이터 마이닝이라는 분야가 생기기 시작했습니다. 아직까지도 데이터마이닝이란 분야는 많이 생소한 분야인데요. 데이터 마이닝이란 무엇일까요? 데이터 마이닝에 대한 몇 가지 정의를 모아봤습니다.

Extracting useful information from larget datasets ( Hand et al., 2001 )

Data mining is the process of exploration and analysis, by automatic or semi-automatic means, of large quantities of data in order to discover meaningful patterns and rules. ( Berry and Linoff, 1997, 2000 )

Data mining is the process of discovering meaningful new correlations, patterns and trends by sifting through large amounts of data stored in repositories, using pattern recognition technologies as well as statistical and mathematical techniques. ( Gartner Group, January 2004 )

 이외에도 데이터 마이닝에 대한 여러가지 정의들이 있습니다. 하지만 공통적인 점은 많은 데이터들의 집합에서 의미있는 정보를 추출해 낸다는 것입니다. 예를 들면, 대형마트의 데이터 집합에서 "기저귀 옆에 맥주를 진열 했더니 매출이 늘어났다."라는 지식을 뽑아 낼 수 있는 것입니다. 남편들이 기저귀를 사러 나와서 맥주도 같이 사는 패턴이 있었던 것입니다. 이렇듯 데이터 마이닝을 이용하면 재미있는 결과와 함께 비즈니스 업계에서느 매출의 증대도 노려 볼 수 있습니다.

Listening Post
Listening Post by Fenchurch! 저작자 표시비영리변경 금지

2. 데이터마이닝은 어디에 쓰이는가?

 데이터 마이닝은 많은 데이터에서 의미있는 정보를 추축해 내는 작업입니다. 의미있는 정보가 어디에 쓰이느냐에 따라서 데이터 마이닝이 어디에 쓰이는지도 결정되게 됩니다.

 대표적인 예가 비즈니스에서 매출 증대를 위한 패턴 분석이 있겠구요. 군사적으로도 여러가지 요소들이 폭탄의 폭파 정확도에 미치는 영향도 분석할 수가 있습니다. 보안에서는 어떤 패킷이 위험 요소를 담고 있는지 기존의 패킷 정보들로부터 예측 할 수 있는 시스템도 있습니다.

 하지만 아무래도 가장 집중을 받고 있는 사용분야는 비즈니스 일 것입니다. 예를 들면 고객들의 키와 매출과의 관계, 나이, 성별과 같은 요소와 매출과의 관계, 매장에 머무는 시간과 매출과의 관계 등등 여러 요인 간의 상호 관계를 처리하여 마케팅의 효율을 높여 줄 수 있습니다.

Attic studio: Enough Computing Power?
Attic studio: Enough Computing Power? by moriza 저작자 표시비영리

3. 데이터 마이닝의 유래.

 데이터 마이닝은 통계학에서부터 시작합니다. 주어진 데이터 집합을 분석해서 목표로 하는 정보를 얻어내는 통계학과 많이 닮은 모습입니다.
 
 하지만 통계학과 많이 다른 모습도 갖고 있습니다. 예를 들면, 일단 통계학을 이용하던 시기에는 얻을 수 있는 데이터 집합의 크기가 매우 작았습니다. 그래서 통계학적 원리와 이론을 적용 시킬 수 있는데에 한계가 많이 존재 했죠. 하지만 데이터 마이닝은 인공지능과 데이터 베이스라는 기계적인 요소를 이용해서 처리를 하기 때문에 기존의 방법보다 더 많은, 더 새로운 지식을 얻을 수 있습니다.

 또 한 기저가 되는 데이터 집합의 수도 웹 2.0 시대, 그리고 저렴한 컴퓨팅 비용으로 인해서 폭발적으로 늘어나고 있습니다. 이런 수 많은 데이터 집합을 이용해서 정보를 이끌어 낸다는 것이 기존의 통계학과 데이터 마이닝 분야가 다른 점입니다.

Information Superhighway
Information Superhighway by nickwheeleroz 저작자 표시비영리동일조건 변경허락

4. 데이터의 폭발적인 증가

 앞에서도 말했듯이 사용할 수 있는 데이터의 증가는 데이터 마이닝의 중요성을 증가시켰습니다. 그럼 이런 폭발적인 데이터의 증가는 어디에서 오는 것일까요?

 첫 번째로 웹의 발달입니다. 누구나 웹에 접속하여 데이터를 생산 할 수 있고, 볼 수 있게 되었습니다. 지금도 매 순간마다 전세계에서 의미가 있던 없던 엄청난 양의 데이터가 생산되고 있습니다. 여러분이 이 글을 보는 순간에도 여러분이 얼마나 접속해 있는지, 어떤 경로를 통해서 들어왔는지 여러분의 IP는 무엇인지 등등이 기록이 되고 있습니다.

 두 번째로 저장 비용의 저렴함입니다. 저장 용량당 비용은 점점 줄어들고 있습니다. 이제 하드디스크가 1TB를 넘는 제품까지 등장하고 있습니다. 불과 10년 전만해도 GB 급의 하드디스크도 정말 유용하고 잘 사용했었죠. 하지만 개인 사용자도 이렇게 데이터들을 하드디스크에 저장을 하고 있는 것을 보면 웹 서버에 저장되는 정보의 양은 정말 엄청 날 것이란 걸 알 수가 있습니다.

 세 번째로 저장되는 정보의 다양화입니다. 초창기에는 저장되는 정보가 별로 없었습니다. 예를 들면, 기상청에서 초창기에는 풍량과 풍향, 온도만 기록했다고 합시다. 하지만 시간이 지나면서 습도도 기록하기 시작했고, 강수량, 강우량도 추가로 기록하기 시작했다고 합시다. 그렇게 되면 생산되는 정보의 양도 늘어나게 됩니다. 이런 현상은 기상청 이외의 많은 부분에서도 볼 수가 있습니다. ( 슈퍼마켓의 고객 분석 시스템의 경우도 마찬가지이죠. )

 이런 데이터의 폭발적인 증가는 데이터 마이닝의 수요를 늘리게 되었고, 데이터 마이닝이라는 분야가 발전하게끔 해주는 원동력이 되었습니다.

Business Graph
Business Graph by nDevilTV 저작자 표시

5. 데이터 마이닝의 방법은??

 데이터 마이닝이란 분야는 정확한 정답이라기 보다는 통계학적 접근이기 때문에 많은 방법론적인 접근이 있습니다. 같은 데이터 집합을 두고 분석하는 방법이 여러가지이기 때문에 분석 결과도 여러가지이죠.

 각 방법들에는 장, 단점이 존재하기 때문에 여러가지 방법이 존재 할 수 있는 것입니다. 데이터 마이닝을 배우는 것도 이런 여러가지 방법들을 잘 이해하고 어떤 프로젝트에 어떤 방법을 사용하는 것이 더 적절한지를 아는 것이 데이터 마이닝을 배우는 목적이라고 할 수 있겠습니다.

Reading Is Fundamental
Reading Is Fundamental by Troy Holden 저작자 표시비영리동일조건 변경허락
 
 앞으로 한학기 동안 데이터마이닝이라는 수업을 듣게 되었는데, 예습이나 수업, 복습을 하면서 기록 해 두었던 것을 포스팅 하겠습니다. 데이터 마이닝을 배우고 싶은 분이나 참고 하실 분들에게 도움이 되었으면 좋겠습니다.





 컴퓨터를 접하는 우리는 항상 데이터를 다루고 있습니다. 하지만 데이터란 무엇일까요? 세상에서 가장 어려운 질문이 정의를 물어보는 것이 아닌가합니다. 막연히 데이터라는 말을 사용하고 있지만 정작 데이터의 정확한 정의는 알고 있지 않습니다. ( 물론 컴퓨터 공학 전공이신 분들은 명쾌한 정의를 다 알고 계실 겁니다. )

Information Superhighway
Information Superhighway by nickwheeleroz 저작자 표시비영리동일조건 변경허락

 데이터는
The term data means groups of information that represent the qualitative or quantitative attributes of a variable or set of variables.
라고 위키피디아는 정의합니다. 한글로 쉽게 풀어 쓰면, 데이터는 사실을 나타내는 수치라고 할 수 있습니다. 예를 들면, 오늘의 날씨 정보에서 오늘 아침 기온, 습도, 날씨 등등 각각의 수치들은 데이터가 됩니다.

Actual is not normal (a tribute to Edward Tufte) by kevindooley 저작자 표시

 하지만 데이터 자체로는 큰 의미가 없습니다. 컴퓨터 공학에서는 데이터를 가공( 처리 : Processing )하여 정보를 만듭니다. 예를 들면 날씨를 나타내는 데이터들 ( 기온, 습도, 풍속, 위성사진 등 )은 기상대나 백엽상 등에서 측정 장비로 관측됩니다. 이 데이터는 그저 사실을 나타 낼 뿐이죠. 이제 이 데이터들을 처리하여 정보를 만듭니다. 기상대에서 측정 된 각각의 데이터들을 바탕으로 내일의 날씨를 예보하게 되죠.
 
Extinct Poster
Extinct Poster by Network Osaka 저작자 표시비영리변경 금지

 데이터를 처리하여 나온 결과를 "정보"라고 하는데, 정보란 간략하게 정의하자면 "사용자의 의사결정에 도움이 될 만한 잘 정리 된 데이터들." 이라고 할 수 있습니다. 현실 세계에서 보자면 구름 사진( 데이터 )이 지구과학 교과서에 사용되어 교육용으로 이용( 정보 ) 될 수도 있고, 사진 작품전에 출품( 정보 ) 될 수도 있습니다.

 컴퓨터는 이런 데이터를 입력 받아서 정보로 만들어 주는 역할을 하는 기계라고 할 수 있습니다.


-- 요약 --
 데이터는 그냥 사실을 나타내는 수치일 뿐이고, 정보는 사용자의 의사결정에 도움을 주는 가공 된 데이터들의 집합이다.


+ Recent posts