카테고리 없음

정규화(Normalization)

하계동물고기 2024. 6. 12. 19:36

정규화 란?

정규화는 관계형 데이터베이스에서 데이터를 구조화하고 중복을 줄이며 데이터의 일관성을 유지하기 위한 과정이다.

이를 통해 데이터베이스의 성능을 향상시키고 데이터의 무결성을 확보할 수 있다.

정규화는 주로 엔티티 간의 관계를 분석하여 데이터를 논리적인 단위로 나누는 작업이다.

정규화의 기본 목표는 테이블 간에 중복된 데이터를 허용하지 않는다는 것이다.

중복된 데이터를 허용하지 않음으로써 무결성을 유지할 수 있으며, DB용량 역시 줄일 수 있다.

 

 

정규화 단계

정규화는 여러 단계로 진행되며, 각 단계는 정규형(Normal Form)이라고 불리는 기준을 충족해야 한다.

각 정규형은 데이터의 구조를 조금씩 변경하여 중복과 종속성을 제거하며, 더욱 높은 수준의 일관성을 유지한다.

 

제 1 정규화

제 1 정규화란 테이블의 컬럼이 원자값(Atomic Value, 하나의 값)을 갖도록 테이블을 분해하는 것이다.

예를 들어 아래와 같은 고객 취미 테이블이 존재한다고 하자.

위의 테이블에서 추신수와 박세리는 여러 개의 취미를 가지고 있기 때문에 제 1 정규형을 만족하지 못하고 있다.

그렇기 때문에 이를 제 1 정규화하여 분해할 수 있다. 제 1 정규화를 진행한 테이블은 아래와 같다.

 

제 2 정규화

제 2 정규화란 제 1 정규화를 진행한 테이블에 대해 완전 함수 종속을 만족하도록 테이블을 분해하는 것이다.

🪧 Info. 완전 함수 종속 : 완전 함수 종속이라는 것은 기본키의 부분집합이 결정자가 되어선 안된다는 것을 의미한다.

 

예를 들어 아래와 같은 수강 강좌 테이블을 살펴보자.

이 테이블에서 기본키는 (학생번호, 강좌이름)으로 복합키이다.

그리고 (학생번호, 강좌이름)인 기본키는 성적을 결정하고 있다.

(학생번호, 강좌이름) --> (성적)

 

그런데 여기서 강의실이라는 컬럼은 기본키의 부분집합인 강좌이름에 의해 결정될 수 있다.

(강좌이름) --> (강의실)

즉, 기본키(학생번호, 강좌이름)의 부분키인 강좌이름이 결정자이기 때문에 위의 테이블의 경우 아래와 같이 기존의 테이블에서

강의실을 분해하여 별도의 테이블로 관리하여 제 2 정규형을 만족시킬 수 있다.

 

제 3 정규화

제 3 정규화란 제 2 정규화를 진행한 테이블에 대해 이행적 종속을 없애도록 테이블을 분해한 것이다.

🪧 Info. 이행적 종속 A → B, B → C가 성립할 때 A→ C가 성립되는 것을 의미한다.

 

예를 들어 아래와 같은 계절 학기 테이블을 살펴보자.

기존 테이블에서 학생 번호는 강좌 이름을 결정하고 있고, 강좌 이름은 수강료를 결정하고 있다.

그렇기 때문에 이를 (학생 번호, 강좌 이름)테이블과 (강좌 이름, 수강료)테이블로 분해해야 한다.

이행적 종속을 제거하는 이유는 비교적 간단하다.

예를 들어 501번 학생이 수강하는 강좌가 스포츠경영학으로 변경되었다고 하자.

이행적 종속이 존재한다면 501번 학생은 스포츠경영학이라는 수업을 20,000원이라는 수강료로 듣게 된다.

물론 강좌 이름에 맞게 수강료를 다시 변경할 수 있지만, 이러한 번거로움을 해결하기 위해 제 3 정규화를 하는 것이다.

즉, 학생 번호를 통해 강좌 이름을 참조하고, 강좌 이름으로 수강료를 참조하도록 테이블을 분해해야 하며 그 결과는 아래 그림과 같다.