데이터 : 현실 세계에서 단순히 관찰하거나 측정하고 수집한 사실이나 값
정보 : 데이터를 의사 결절에 유용하게 활용할 수 있도록 처리한 결과 값
데이터베이스
정의
특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해 저장한 운영데이터의 집합
핵심개념
공유 데이터
- 사용 목적이 다른 사용자들을 두루 고려하여 구성해야 한다.
통합 데이터
- 데이터의 중복을 최소화하고 통제가 가능한 중복만 허용하는 데이터로 구성해야 한다.
저장 데이터
- 컴퓨터가 접근할 수 있는 매체에 저장.
운영 데이터
- 지속적으로 유지해야 하는 데이터
특징
실시간 접근
- 사용자의 데이터 요구에 실시간으로 응답할 수 있어야 한다.
계속 변화
- 삽입, 삭제, 수정하여 동적인 변화를 하여 정확한 데이터를 유지
동시 공유
- 여러 사용자가 서로 다른 데이터와 같은 데이터를 동시에 사용가능
내용으로 참조
- 지정된 주소나 위치가 아닌 내용 즉, 값으로 참조할 수 있다.
형태에 따른 데이터 분류
정형 데이터
- 표 안의 행과 열에 의해 지정된 칸에 데이터를 저장하는 구조
- 엑셀, 관계 데이터베이스
반정형 데이터
- 구조에 따라 저장된 데이터이지만 데이터 내용 안에 구조에 대한 설명이 함께 존재
- 구조를 파악하기 위한 파싱과정이 필요
- JSON, XML, HTML
비정형 데이터
- 정해진 구조가 없이 저장된 데이터
- 소셜 데이터의 텍스트, 영상, 이미지, PDF 등
특성에 따른 데이터 분류
범주형 데이터
범주로 구분할 수 있는 값, 종류를 나타내는 값을 가진 데이터
명목형 데이터
- MBTI, 혈액형 등 서열이 없는 데이터
순서형 데이터
- 학년, 학점 등 서열이 있는 데이터
수치형 데이터
양적 측면에서 크기 비교와 산술적인 연산이 가능한 숫자를 가진 데이터
이산형 데이터
- 고객수, 판매량 등 단절된 숫자 값을 가지는 데이터
연속형 데이터
- 측정을 통해 얻어지는 키, 몸무게 온도 등 연속된 숫자 값을 가지는 데이터
참고) 데이터베이스 개론
'공부 > 데이터베이스' 카테고리의 다른 글
2장 데이터베이스 관리 시스템 (0) | 2023.06.29 |
---|