데이터란? 데이터(Data), 정보(Information), 지식(Knowledge)
매우 지루하지만 데이터베이스의 정의를 이해하기 위해서는 간략하게나마 데이터가 무엇인지를 알아야 합니다. 데이터란 관찰한 결과로 나타난 정략적 또는 사실 그대로의 값을 말합니다. 정보는 데이터를 가공하여 의미를 부여한 것입니다. 지식은 어떤 목적을 달성하기 위한 이용 가치가 있는 정보이며, 사물이나 현사에 대한 이해를 말합니다.

역시나 사전적인 정의로 설명하자면 너무나 딱딱하고 어려우니 예를 들어보도록 하겠습니다. 서울에 있는 빌딩 높이에 대해 63빌딩의 높이는 274m, 롯데타워의 높이는 555미터라는 사실 그대로의 수치는 데이터라고 할 수 있습니다. 여기서 알아낸 데이터를 가공하여 63빌딩보다 롯데 타워가 281m 더 높다 라는 것은 정보에 해당합니다. 그리고 한국에 놀러온 외국인 친구에게 서울의 전망을 구경시켜 주려면 63빌딩보다는 롯데 타워가 더 좋겠구나 라는 지식을 얻을 수 있습니다.

예를 들어도 데이터와 정보 지식의 경계가 모호할 수 있습니다만 사실 데이터 정보 지식은 서로 별개의 개념이 아니고 목적이나 때에 따라서는 정보였던 것이 지식이 되기도 하고 지식이었던 것이 정보가 될 수 있습니다.




데이터베이스
데이터베이스는 위에서 언급한 데이터의 집합 또는 어떤 조직에 필요한 정보를 도출해내기 위해 연관된 데이터를 모아 구조적으로 통합한 것입니다. 역시 어렵습니다. 앞에서 말한 데이터 라는 개념이 이해가 안되셨다면 더욱 어려울 수 있습니다. 역시 예를 들어보아야 합니다.

학교에서 학생과 관련된 데이터들을 구조화 하여 통합한 것은 학생 데이터 베이스, 영화관을 운영하기 위해 영화와 관련된 데이터들을 구조화하여 통합한 것은 영화 데이터베이스 라고 이해할 수 있습니다.

어떤 조직에 필요한 정보를 도출해내기 위해서 모은 데이터라고 했는데, 학생 데이터베이스를 구축하는 이유는 학생들과 관련된 데이터로 정보를 도출해 내기 위함입니다. 예를 들어 OO과 OO학번의 학생은 이번학기 평균 학점이 OO점이다 라는 식의 정보들을 도출할 수 있습니다.



데이터베이스의 개념
데이터베이스의 개념은 처음 들어도 이해가 되지도 와닿지도 않지만, 이해하면 아~ 하게 되는 그런 부분입니다. 또한 정보처리기사/산업기사 등에 자주 출제되므로 간단하게나마 머릿속에 저장해 두는것이 좋습니다. 학생때 데이터 베이스를 배우며, 아니 데이터베이스는 xxx다 라고 설명하면 되지 뭘 이렇게 복잡하게 설명해? 라고 했던 기억이 나는군요.

그래도 데이터베이스의 개념을 알아야 하니.. 앞에서 간략이 데이터베이스가 무엇인지 설명했지만 데이터베이스의 개념을 말하자면 여기서 설명할 통한된 데이터이며, 저장된 데이터, 운영되는 데이터이며 공용 데이터이다 라고 할 수 있습니다.


통합된 데이터(Integrated Data)
여러 곳에 나누어져 있던 데이터를 하나로 통합하여 저장한 데이터를 의미합니다. 만약 학생 데이터베이스에서 학생에 대한 데이터들이 여기저기 흩어져서 관리된다면 관리하기도 어렵고 중복이 발생되어 여러가지 문제가 발생할 수 있습니다.

예를 들어 교내에 수십명의 교사가 각각 학생 데이터를 엑셀 파일로 복사하여 나누어 관리한다면 데이터의 중복이 발생합니다. 이러면 데이터의 낭비도 낭비지만 누군가가 데이터를 수정했을때 동시에 서로 약속한듯 똑같이 수정해주어야 하는데, 실수로 누군가가 다르게 수정한다면 나중에 취합했을 때 데이터가 꼬일 수 있습니다.

따라서 데이터베이스는 이러한 문제를 해결하기 위해 데이터를 통합하고 저장하여 관리합니다.


저장된 데이터(Stored Data)
저장된 데이터는 실제 존재하는 문서가 아닌 물리적인 하드디스크, SSD 등의 저장장치에 기록된 데이터를 의미합니다. 옛날처럼 학생 데이터를 A4 용지등에 문서로 작성하여 보관하는 데이터는 저장된 데이터가 아니므로 데이터베이스라고 할 수 없습니다.


운영 데이터(Operational Data)
어떤 조직의 목적을 위해 운영되는 데이터입니다. 예를 들어 무역 회사인데 내가 이번주에 매 끼니마다 몇 kcal의 열량을 섭취했는지에 대한 데이터를 기록한다면 이 데이터는 운영 데이터라고 할 수 없습니다.



공용 데이터(Shared Data)
어떤 한 개인이 아닌 여러 주체가 같이 공용으로 사용되는 데이터를 말합니다. 어떤 개인 혼자만 이용할 수 있는 데이터는 공용 데이터가 아닙니다.





데이터베이스의 특징
지금까지 데이터베이스의 개념에 대해 알아보았습니다. 데이터베이스의 특징은 어떤 것이 있을까요? 이 역시 여러 시험에 많이 출제되는 내용입니다. 개념과 특징이 뭐가 다른것인지 헷갈릴 수 있습니다만 정말 무식한 예를 들어보자면 "인간이란 고도의 지능을 가진 사회적 고등 생물이다" 가 정의 및 개념이라 한다면 인간의 특징은 "인간은 나이가 들수록 늙어가다가 언젠가 죽는다", "인간은 인정받고 싶은 욕구가 있다" 등이 될 수 있습니다.


그렇다면 본격적으로 데이터베이스의 특징을 알아보겠습니다. 데이터베이스의 개념에 따른 특징이기 때문에 겹치는 내용이 있을 수 있습니다.


실시간 접근성(Real Time Accessibility)
데이터베이스는 실시간으로 운영되며 서비스하는 특징을 가지고 있습니다. 학생데이터베이스는 실시간으로 서비스되므로 교수님 및 학생들이 원하는 데이터를 추출하고 싶을때 실시간으로 제공할 수 있습니다.


계속적인 변화(Continuous change)
찰나의 순간으로 보면 데이터베이스에 저장된 데이터는 특정한 상태를 나타내는 것처럼 보이지만 시간에 흐름에 따라 보면 데이터는 계속해서 삽입, 삭제, 수정이 일어나기 때문에 계속해서 변화합니다.


동시 공유(Concurrent Sharing)
데이터베이스는 불특정 다수가 사용하므로 어느 찰나의 순간에 보면 동시에 공유되고 있는 특징이 있습니다. 예를 들자면 수강 신청이 시작되자마자 수많은 학생들은 좋은 시간표를 짜기 위해 학사정보 시스템에 동시에 접근하는데 이때 학생 데이터베이스는 수많은 학생들에 의해 동시 공유됩니다.


내용에 따른 참조(Reference by Content)
데이터베이스의 개념에서 소개했지만 데이터는 물리적인 하드디스크, SSD 같은 저장장치에 기록된다고 했습니다. 이러한 저장장치의 특징은 데이터가 저장되고 그 데이터가 저장되는 위치를 주소값으로 관리한다는 사실입니다. 그러나 데이터베이스에서는 그런 주소값을 통해 데이터를 참조하는 것이 아닌 저장된 데이터 내용을 기준으로 참조하는 것입니다.

즉 A 학생이 학번을 통해 자신의 학사 정보를 조회하고 싶은 경우 자신의 정보가 저장된 디스크의 주소값을 통해 조회하는 것이 아닌 xxxx라는 사번을 조건으로 데이터를 검색하게 됩니다.


정말 딱딱하고 지루한 데이터베이스의 개념을 알아보았습니다. 다음글 역시 재미없고 지루한 DBMS란 무엇인가에 대해 알아보도록 하겠습니다.


다음글




블로그 이미지

도로락

IT, 프로그래밍, 컴퓨터 활용 정보 등을 위한 블로그

,