'분류 전체보기' 카테고리의 글 목록 (2 Page)

분류 전체보기

[SQL-D]#03. 데이터 모델링의 이해 - 논리적 모델링 2021.04.19
[사조사2급필기]#01.사회통계-기술통계 2021.04.16 1
[SQL-D]#02데이터 모델링의 이해 - 엔터티, 속성, 관계, 식별자, 비식별자 2021.04.16 1
[SQL-D]#01 데이터 모델링의 이해 - 모델링, 데이터 모델링, ERD 2021.04.14
2021 정보처리기사 필기 - 합격후기, 교재, 공부법(feat.독학VS인강) 2021.03.29 1

[SQL-D]#03. 데이터 모델링의 이해 - 논리적 모델링

2021. 4. 19. 20:48

dasp를 공부하면서 논리적 데이터모델링 정리부분이 있어 부록으로 올립니다.

데이터 모델링 이해

논리 데이터 모델링의 핵심은 업무에서 필요로 하는 데이터에 존재하는 사실을 인식, 기록하는 것이다.

→ 어떤 조직의 업무 사실에 기초하여

그 조직에서 필요로 하는 데이터의 구조 및 업무 규칙을 논리 데이터 모델에 기록

하는 것이다.

논리 데이터 모델링 필수 성공 요소

업무를 알고 있는 전문가의 참여

는 필수적이다

절차보다는 데이터

에 초점을 두고 모델링을 진행해라

- 데이터의 구조와 무결성을 함께 고려해라

개념화와 정규화 기법

을 적용해라

개념화: 현실세계에서 발생하는 업무 데이터를 엔터티, 관계, 속성으로 표현하는 추상화와 동일

정규화: 데이터의 올바른 위치를 찾아주는 기법

다이어그램

을 이용하여 업무를 표현해라

- 데이터 모델링을 지원하는

데이터 사전

을 구축해라.

논리데이터 모델링 절차

주제영역정의 → 엔터티정의 → 관계정의 → 속성정의 → 식별자확정 → 정규화 → 이력관리

주제영역 정의

주제영역은 주요 자원, 상품, 활동을 중심으로 조직이 관심을 가지는 영역이다.

주제영역은 조직이 사용하는 데이터의 최상위 집합이다.

예를 들어 제조업체의 경우 인사, 고객, 상품, 구매, 생산, 판매 분야 등의 주제 영역이 있을 수 있다.

하나의 주제 영역 내에 정의되는 엔터티간의 관계는 밀접하고, 다른 주제 영역에 포함되는 엔터티 간의 상호작용은 최소화할 수 있도로 정의해야 한다.

계획수립 단계는 하향식 분석을 원칙으로 하고, 검증을 위해서 상향식 분석을 부분적으로 사용한다.

데이터를 하향식으로 분석하기 위한 개념으로 유용한 것이 주제영역이다.

주제영역은 데이터의 계층 구조를 파악하는데 도움을 주며, 품질 확보에도 기여한다.→ 시간을 단축시키지는 않는다.

엔터티 정의

엔터티란 조직에서 업무를 수행하는데 필요한 사물, 사건 또는 개념을 나타내는 어떤 것

현실 세계에 무수히 존재하는 인스턴스들을 추상화라는 개념을 통해서 엔터티로 정의하여 사용.

엔터티분류

- 일반적인 분류

유형엔터티: 물리적으로 존재하는 대상(고객, 상품)

활동엔터티: 어떤 사건에 관한 정보(주문, 계약, 장비고장 등)

개념엔터티: 관리할 정보가 있는 무형의 개념(계정과목, 성적)

- 모델관점 분류

독립엔터티: 인스턴스의 식별을 위해 다른 어떤 인스턴스에도 의존적이지 않은 엔터티

종속엔터티: 인스턴스의 식별을 위해 다른 인스턴스에 의존해야만 식별이 가능하다.

- 발생시점 분류키 엔터티

: 자신의 부모를 가지지 않는 엔터티

사원 엔터티에 있는 '홍길동'이란 인스턴스는 아직 부서가 정해지지 않았더라도 사원으로서 정의하는데 아무 문제가 없다.

키 엔터티를 제외한 다른 모든 엔터티는 부모 엔터티를 가지고 있어야만 태어날 수 있다.

메인 엔터티

: 키 엔터티를 제외한 엔터티 중에서 업무의 중심에 해당하는 엔터티

액션 엔터티

: 키엔터티, 메인엔터티를 제외한 전부

모델링이 좀 더 구체적으로 진행되더라도 키 엔터티와 메인 엔터티는 집합의 본질이 크게 달라지지 않는다. 그러나

액션 엔터티는 상위 엔터티들이 어떻게 결정되느냐에 따라서 크게 영향을 받기 떄문에 업무의 본질은 살아있지만 최초에 예상했거나 과거에 정의했던 식별자가 크게 달라질 수도 있따.

엔터티 도출

기업의 전략&목표 분석, 현 시스템 분석, 사용자 인터뷰, 정보요구 분석, 문서&보고서 작업

엔터티 검증

논리 데이터 모델에 표현되는 모든 엔터티는

1. 데이터 모델의 구현 주체인

조직의 업무를 수행하는데 필요한 의미있는 정보

를 나타내야 한다.

조직에 따라서 엔터티의 범위는 천차만별 일 수 있다.

하나하나의 특성 사례가 아닌 유사한 사물들을 대표하는 집합체

여야 한다.

'구매부서에서 공급처에 자재를 주문한다'와 같은 업무 분석 사항에서 만약 엔터티를 '구매부서'로 정의하게 되면, 조직 내에 엔터티가 너무 많아 관리가 불가능하다. → 구매부서는 단일사례

이의 경우에 엔터티를 '부서'로 정의하고, 구매부서는 이 엔터티의 인스턴스가 된다.

3. 속성들에 의해 결정된 단일 개념을 나타내야 한다.

4. 엔터티 내 인스턴스의 출현을 구별할 수 있는 능력을 제공해야하며, 정규화 규칙 만족.

엔터티는 인스턴스를 구별할 수 있는 능력을 제공해야한다. 엔터티 무결성

인스턴스를 구별할 수 있는 능력, 즉 식별이란 여러분들이 얘기하고 있는 사물이나 사람을 알고 있냐는 것이다.

엔터티 내 인스턴스의 출현을 구별할 수 있는 능력을 제공하기위해 식별자를 구성하는 일련의

1) 속성값이 반드시 있어야 하고

2) 이 값들이 유일해야 하며

3) 이 일련의 속성이 최소한의 개수로 이뤄져야 한다.

엔터티 구체화

식별자 확정 → 정규화 → M:M관계해소 → 참조무결성 정의

1)식별자 확정단계

이제까지 논리적 의미의 식별자(본질 식별자)를 기준으로 관계들이 생성되고 속성들이 정의되었다면 이 단계는 실질적 식별자를 생성한다.

2)정규화 단계

정규화는 논리적 데이터 모델의 일관성을 유지하고 중복을 제거하여

보다 안정적인 모델

을 만드는 단계이다.

3)M:M 관계해소

개념 데이터 모델에서 핵심 엔터티들간의 M:M관계가 해소되면서 교차 엔터티(Intersection entity)가 생성되는 단계이다.

4)참조무결성 정의단계

관계 정의

관계란 하나 또는 두 개의 엔터티로부터 인스턴스를 연관시키는 업무적인 이유이다.

이러한 업무규칙은 업무를 전산화하기 이전에 다시 말해 전산화와는 독립적으로 이미 업무에 존재하는 사실이라는 점을 명심해야한다.

관계개념

- 부모 자식 엔터티

하나 또는 두개의 엔터티 사이 관계가 있을 때 기수성과 선택성에 따라 부모, 자식엔터티를 구분.

→

외래키가 나타나는 곳이 자식 엔터티라고 생각하면 쉽다

- 일대다 기수성의 경우에는 '일'쪽이 부모이고 '다'쪽이 자식이다.

- 일대일 기수성의 경우에는

선택성 '필수'쪽이 부모이고 '선택'쪽이 자식

이다.

- 다대다 기수성의 경우에는 일대다의 연관엔터티로 정련한다.

* 관계를 해석하는 방식

항상 어느 엔터티에 인스턴스가 입력되는 시점에 관계가 있는 상대편의 엔터티에 인스턴스가 필요한지 필요없는지를 근거로 관계의 선택성을 결정한다.

→ 하나의 주문 입력 시 고객은 반드시 입력되어 있어야한다. <

필수

→ 하나의 고객 입력 시 주문은 입력 안 될 수도 있다. <

선택

관계 도출

관계란 하나 또는 두 개의 엔터티로부터 인스턴스를 연관시키는 업무적인 이유라고 하였다. 만약 엔터티만 알고있고 엔터티의 인스턴스가 무엇인지를 알 수 없으면 정확한 관계를 설정할 수 없다.

EX)

'업무영역' 엔터티의 인스턴스들이, 즉 인스턴스가 '인사', '급여', '구매', '생산' 등이고, 'DB'엔터티의 인스턴스들이 '인사DB', '급여DB', 구매DB'등 업무영역과 동일한 단위의 DB를 관리하는 것이라면 이 두 엔터티의 관계는 1:1 한쪽 필수 한쪽 선택 식별 관계가 될 것이다.

하지만 만약에 DB 인스턴스들이 ORACLE, SQL Server, Sybase와 같이 특정 데이터베이스 관리 시스템을 말하게 된다면 일대다의 관계가 형성될 것이다

→ 엔터티를 그 조직에서 어떻게 정의하느냐에 따라 관계 정의가 달라질 수가 있다.

다대다 관계의 경우 카티션 프로덕트가 발생하여 정보의 왜곡이 발생한다. →연관관계로 해소

특수관계

- 자기참조관계

계층 구조 모델은 자기 참조 관계가 아닌 부모의 식별자를 자식의 식별자의 일부로 사용하면서 조직의 계층 구조를 표현하고 있다.

→

이러한 계층 구조 모델은 조직 변경이 일어나는 경우, 이에 대한 대응을 원활하게 하기 매우 어렵다.

조직과 같이 계층 구조를 갖는 업무에서 계층구조

순환 전개 모델처럼 관계로 표현해야 조직 변경에 탄력적으로 대응할 수 있다.

조직은 계층 구조가 년 단위 내지는 조직 경영의 목적상 필요한 경우 등등 지속적으로 변화한다. 하지만 회계 업무의 계정 과목은 계층 구조가 한 번 결정되고 나면 변화가 거의 없다고 해도 과언이 아니다.

같은 계층구조이지만 업무의 변화 가능성에 따라 이를 모델링하는 방법이 다른 것이다.

→ 계층 구조 변경에 매우 유연하다.

→

계층구조 변경시 데이터의 수정이 없다

→ 계층 구조이면서 변동이 발생하는 업무에 적용한다.

- 배타적관계

어떤 엔터티의 행이 두 개 이상의 다른 엔터티의 행과 관계를 맺는데 있어서

어느 시점에 반드시 하나의 엔터티의 행과 관계를 맺는 형태.

EX)

'출고'의 행이 두 개 이상의 다른 엔터티와('공정', '창고') 관계를 맺는 데 있어서 어느 시점에 반드시 하나의 엔터티의 행과 관계를 맺는 형태를 말한다.

배타적 관계는 항상 필수이거나 선택이어야 한다.

배타적 관계는 반드시 하나의 인스턴스에만 속해야 한다.

속성정의

속성: 데이터베이스 내에 저장되는 최소 단위의 정보

속성도출

현행 시스템 자료, 현업 장표&보고서, 사용자와 협의, 데이터 흐름도의 데이터 저장소, 전문 서적 및 자료, 다른 시스템 자룦

속성 정의사항

- 각 속성에 대한 상세 정보의 중요성

→ 업무 관련 데이터의 본질과 목적을 이해하는데 도움을 준다

→ 속성 수준의 무결성을 설정하고 강화하는데 도움을 준다

→ 데이터 무결성을 개선하여 데이터 품질을 향상시킨다

→ 데이터 사전을 구성한다.

- 속성 명

속성명만 보고서도 내용이 무엇인지를 쉽게 이해할 수 있도록 명명하는 것이 좋다.

유일한 복합명사를 사용

→ 속성이란 자신만이 가지는 분명한 독립적인 의미를 가지고 있기 때문에 명칭 또한 단순히 일반 용어만으로 부여해서는 결코 구체적인 의미를 나타낼 수 없다.

- 속성 유형

기본속성: 속성 값이 해당 인스터스에 원래 존재하여, 다른 속성 값으로부터 유도될 수 없는 속성

유도속성

: 속성 값이 항상 다른 속성의 값으로부터 유도되거나 계산되는 속성

→유도속성은 어떤 상수 값으로 지정되는 것이 아니라, 유도 알고리즘이라는 계산을 수행한 결과를 유도 속성의 값으로 반환한다.

설계속성: 업무 제약사항을 반영하거나 시스템 운영을 단순화하기 위하여 생성하는 속성

(기본과 설계는 일반적으로 동일하게 다룬다)

속성 검증 및 확정

원자 값 단위까지 분할 → 하나의 값만을 가지는지 검증 → 유도 속성인지 검증

가. 원자값 단위까지 분할

데이터 모델 내 모든 속성은 원자적(atomic)이여야 한다. 한 엔터티에 나타난 속성값은 업무적인 이유에 의해 논리적으로 더이상 분해될 수 없는 단위값(Unit value)이다.

EX)계좌번호(16) = 지점코드(3) + 상품코드(2) + 계좌개설일자(8) +;;;;; 이와 같은 식으로 할 경우 원자값 단위까지 분할원칙을 져버리게 된다.

나. 하나의 값만을 가지는지 검증

속성에서 관리되어야할 값이 반드시 단 하나만 존재해야 한다.

→ 엔터티에 들어가는 인스턴스마다 반드시 하나의 값만 보유하고 있어야 한다는 것이다.

다. 유도속성인지 검증

속성이 원천적인 값인지, 다른 속성에 의해 가공되어서 만들어진 값인지를 검증하는 것이다.

추출 값이란 원천적인 값을 가지고 언제라도 쉽게 재현할 수 있는 속성을 말한다.

cf) 유도 속성은 절대 식별자의 역할을 맡아서는 안된다 절대

식별자 확정

후보 식별자 도출 → 보조 식별자 → 인조 식별자 지정 → 식별자 확정

엔터티 내의 모든 인스턴스는 유일하게 구분되어야 한다. 이러한 유일성을 보장하기 위해서 필요한 것이 식별자이다. 현실세계에서 매우 유사한 특성을 가지는 두 개의 사물을 어떻게 구별할 것인가? → 식별자의 중요성

본질식별자 - 업무에서 사용하는 속성을 이용하여 유일성을 보장한다.

→ 기준정보 엔터티, 거래처리 엔터티에 따라 다르게 정의된다

- 기준정보 엔터티

사원, 고객, 상품과 같이 부모 엔터티 없이도 혼자서 정의될 수 있는 엔터티이다.

- 거래처리 엔터티

하나의 인스턴스를 유일하게 발생하시키는 일련의 속성이 어느 부모로부터 상속되었는지를 찾고자 하는 것이며, 결국 자신을 있게 한 근본을 찾는 것이다.

1. 후보 식별자 도출

이전 단계에서 정의된 본질 식별자를 기본으로 식별자의 자기 목적인 자기를 식별할 수 있어야한다는 유일성 유지의 목적과 다른 엔터티에서 정보로 참조해야 하는 목적을 적절히 판단하여 최종식별자를 확정해야 한다.

- 하나의 엔터티 내에는 식별자로 사용할 수 있는 하나 이상의 식별자가 있다. 이 중에서 하나의 식별자로 선택되게 된다. 나머지 식별자들을 후보 식별자라고 한다.

→ 널이 될 수 없다.

→ 각 인스턴스들을 유일하게 식별할 수 있어야 한다.

→ 나머지 속성들을 직접 식별할 수 있어야 한다.

→ 후보 식별자로 속성 집합을 선택하는 경우에는 개념적으로 유일해야 한다.

→ 후보 식별자의 데이터는 자주 변경되지 않는 것이여야 한다.

보조식별자 → 유일성 O, 대표성 X (회사에서의 주민등록번호)

엔터티 내에서 하나의 인스턴스를 유일하게 식별할 수 있는 속성이지만 대표성을 갖지 못하는 속성

사원 엔터티에 공식적으로 부여된 식별자는 사원번호이지만, 만약 주민등록번호 속성이 유일한 값을 가지면서 필수적으로 정의되었다면, 비록 공식적인 식별자는 아니지만 식별자로서의 역할을 할 자격은 충분히 갖추고 있다.

2. 인조식별자 지정

업무에서 사용하는 속성이 아닌 인위적으로 만든 속성으로 유일성을 보장한다. 기존의 본질 식별자를 그대로 인정할 수 없는 여러가지 상황이 발생했을 때, 전부 혹은 일부의 값을 가진 속성들로 대체하여 새롭게 구성한 식별자를 말한다.

최대한 범용적인 값을 가진다. - 유일한 값을 만들기 위한 인조 식별자를 사용한다. - 하나의 인조 식별자 속성으로 대체할 수 없는 형태를 주의한다. - 편의성&단순성 확보를 위한 인조 식별자를 사용할 수 있다. - 의미의 체계화를 위한 인조 식별자를 사용할 수 있다. - 내부적으로만 사용하는 인조 식별자

3. 식별자 확정

식별관계의 두가지 의미

- 식별자로서의 역할

엔터티 자신의 입장에서 보았을 때 자신의 인스턴스들을 다른 것들과 구별될 수 있도록 유일한 값을 만드는데 일조한다는 의미이다

- 정보로서의 역할

참조하는 엔터티의 입장에서 보았을 떄, 상대방의 식별자를 상속 받았기 떄문에 자신이 보유한 정보가 증가했다는 의미도 있다.

식별자 확정절차

하향식방식

, 즉 상위 엔터티부터 시작해 하위 엔터티로 순차적으로 결정해가는 것이 좋다. 식별자 상속이란 상위에서 하위로 이루어지기 때문이다.

가. 기준정보 엔터티 식별자 확정

나. 중요거래처리 엔터티 식별자 확정

다. 기타거래처리 엔터티 식별자 확정

관계 선택성 VS 관계 식별성

관계선택성 표기법

필수:

다른 엔터티에 어떤 행을 입력하기 전에 상대 엔터티에 적어도 한 건의 행이 반드시 있어야하는경우

선택:

다른 엔터티에 행을 입력하기 전에 상대 엔터티에 어떤 행이 존재할 필요가 없는경우.

CASE Method에서는 필수를 실선, 선택은 점선

IE에서는 필수는 동그라미 생략, 선택은 관계선에 동그라미

관계식별성 표기법

식별:

부모 엔터티의 식별자가 자식 엔터티의 식별자의 일부분이 되는 관계

비식별:

부모 엔터티의 식별자가 자식 엔터티의 식별자의 일부분이 되지않고, 일반 속성이 되는 경우

CASE Method에서는 식별을 UID BAR, 비식별 UID BAR생략

IE에서는 식별을 실선, 비식별을 점선

정규화(Normalization)

정규화는 엔터티에 데이터의 입력, 수정, 삭제 연산을 수행할 때 발생하는 이상현상을 제거하여 논리 데이터 모델링의 목적인 정확성, 일관성, 단순성, 비중복성, 안정성을 만족시키는 최적의 데이터 구조를 만들어가는 과정이다.

정규화 과정은 중복 데이터를 제거하여 최적의 데이터 구조로 만들기 위해 여러 단계를 거친다.

- 정규화의 장점

중복 값이 줄어든다. → 정규화의 최대성과

새로운 요구사항의 발견과정을 돕는다. NULL값이 줄어든다.

복잡한 코드로 데이터 모델을 보완할 필요가 없다. 데이터 구조의 안정성을 최대화한다.

Anomaly(이상현상)

- 입력이상

데이터를 입력하려고 할때 원하지 않는 데이터도 함께 입력해야 하는 구조로 되어 있는 경우

- 수정이상

일부 속성값을 수정함에 있어서 원하지 않는 정보의 이상현상 발생하는 경우

- 삭제이상

일부 정보를 삭제함으로써 유지되어야 할 정보까지도 연쇄삭제되는 현상

제 1정규형

- 모든 속성은 반드시 하나의 값을 가져야 한다. 즉 반복 형태가 있어서는 안된다.

- 각 속성의 모든 값은 동일한 형식이여야 하다.

- 각 속성들은 유일한 이름을 가져야 한다.

- 행들은 서로간에 식별이 가능해야 한다.

→ 어떤 속성이 다수의 값 또는 반복 그룹 값을 가지고 있다면 일대다 엔터티를 추가한다.

→ 비정규형 릴레이션이 릴레이션으로서의 모습을 갖추기 위해선 여러 개의 복합적인 의미를 가지고 있는 속성이 분해되어 하나의 의미만을 표현하는 속성들로 분해되어야 한다.

제 2정규형

식별자가 아닌 모든 속성은 식별자 전체 속성에 완전 종속되어야한다.

부분적 함수의 종속성 제거원칙을 준수한다.

기본키가 2개 이상으로 구성된 엔터티에서 일반속성이 PK속성들 중 일부 속성에 대해서만 부분적 종속성이 있는 속성일 경우 해당속성을 제거한다.

- PK가 1개인 엔터티는 제 2정규화 대상에서 제외한다.

- 한 속성이 PK 모두에 대해서 종속성이 있지 않고 부분적 종속성만 있을 경우 이를 별도 테이블로 관리한다.

- 보통 키가 복합속성일 때, 일부 속성이 일부 키에 종속이 발생하는 것을 말한다.

→2차 정규화를 진행하면 보통 부모 엔터티가 생긴다.

EX)

주문번호 + 상품코드로 이루어진 주문상품 엔터티에서 상품명이 상품코드에 종속적이다.

제 3정규형

제 2정규형을 만족하고 식별자를 제외한 나머지 속성들 간의 종속이 존재하면 안된다.

기본적으로 엔터티 내 모든 속성들은

기본키에 의존성을 가져야 한다

기본키에 의존하지 않고 일반속성에 의존하는 속성을 제거 또는 분리한다.

ex)메일주소 속성은 PK인 글번호에 의존하지 않고 고객아이디에 의존하기 때문에 분리해야 한다.

이력관리

데이터는 현재의 프로세스만 처리하고 버리는 것이 아니라 마치 후손에게 물러주어야 할 귀중한 문화유산처럼 오랜 기간의 데이터를 유지시켜 좀 더 가치있는 정보를 제공할 수 있는 밑거름이 되도록 해야한다.

1)발생 이력 데이터

어떤 데이터가 발생할 때마다 이력 정보를 남겨야만 한다면 발생이력이라고 볼 수 있다. 이벤트가 발생할 때에만 이력 데이터를 발생하는 방법이 있고, 이력이 발생하지 않더라도 날마다 데이터를 생성하는 방법이 있다.

2)변경 이력 데이터

데이터가 변경될 때마다 변경 전과 후의 차이를 확인해야 한다면 변경이력을 남길 수 있다. 예를들어 고객이 주문을 하고서 주문 정보를 변경하였을 때, 이전 주문과 변경된 새로운 주문 정보를 관리하기 위해 변경된 새로운 주문 정보를 이력 정보로 남겨야한다.

3)진행 이력 데이터

업무의 진행에 따라 이 데이터를 이력 정보로 남겨야만 하는 경우. 주문과 같은 업무처리

구매친성 → 입금완료 → 배소중비 중→ 배송중→배송완료 혹은 주문취소

이력관리형태

1)시점이력

데이터의 변경이 발생한 시각만을 관리

특정 통화의 환률이 변경되면 새로운 인스턴스가 생겨나고, 그 시점의 해당 통화 환율과 발생시각을 기록&보관함으로써 환율이 어느 시점에 얼마의 값으로 변경되었다는 정보를 관리하는 것이다.

2)선분이력

데이터 변경의 시작 시점부터 그 상태의 종료 시점까지 관리

가 통화의 특정기간동안 유효한 환률을 관리

선분이 아무리 길어도 레코드는 하나이다.

선분이력관리 유형

인스턴스 레벨 이력관리

속성 레벨 이력관리

주제 레벨 이력관리

Uploaded by Notion2Tistory v1.1.0

'Certification_Note > SQL-D' 카테고리의 다른 글

[SQL-D]#06 데이터 모델과 성능 - 파티셔닝 & 분산 데이터 모델 (0)	2021.04.20
[SQL-D]#05 데이터 모델과 성능 - 정규화, 반정규화와 성능 (0)	2021.04.19
[SQL-D]#04 데이터 모델링의 이해 - 물리 데이터 모델링 (1)	2021.04.19
[SQL-D]#02데이터 모델링의 이해 - 엔터티, 속성, 관계, 식별자, 비식별자 (1)	2021.04.16
[SQL-D]#01 데이터 모델링의 이해 - 모델링, 데이터 모델링, ERD (0)	2021.04.14

[사조사2급필기]#01.사회통계-기술통계

2021. 4. 16. 14:32

대푯값(자료 전체를 대표하는 값)

- 분포의 중심위치를 나타내는 측정치이다.

- 대푯값은 분포의 중앙 또는 도수의 집중점과 반드시 일치하지는 않는다.

- 관찰된 자료들이 어느 곳에 가장 많이 모여있는가를 나타내는 것 → 집중화 경향

집중화 경향을 나타내는 수치 = 산출평균, 중위수, 최빈값

계산적인 대푯값: 산술평균, 기하평균, 조화평균, 평방평균

위치적인 대푯값: 중위수, 최빈수, 사분위수, 백분위수

계산적인 대푯값

표본을 가지고 산출하는 것이 아닌, 변수 전체를 사용하여 계산해 내는 값.

한 값이라도 변하게되면 대푯값에 영향을 준다.

극단적인 변수에 의해 영향을 받기 때문에 추상적인 대푯값이라고도 한다.

평균은 이상치에 영향을 많이 받는다.

1) 산술평균(X바)

n개의 수가 있을 때, 이들의 합을 개수로 나눈 것. 우리가 일반적으로 생각하는 평균

$\frac\sum _{}xi = \frac$

2) 기하평균 (G)

변화율이나 비율의 평균을 구할 떄 이용하는 수치로서 모든 측정치를 곱하여 측정치의 수만큼 제곱근을 구한 것이다.

- 극단적인 변수의 값에 영향을 받지만 산술평균보다는 적게 받는다.

- 인구변동률, 물가변동률, 경제성장률과 같은 비율의 대푯값 산정에 많이 쓰인다.

G = $\sqrt[n]$

3) 조화평균 (H)

n개의 양수에 대하여 그 역수들을 산술평균한 것의 역수를 말한다.

- 추상적인 대푯값으로 극단적인 값의 영향을 받으며, 역수를 갖는 변량 외에는 거의 사용 x

- 단위당 평균 산출에 이용한다.

H = $\frac{\sum \frac}$

위치적인 대푯값

1)중위수(Me)

통계집단의 측정값을 크기순으로 배열했을 때 중앙에 위치한 수치를 말한다.

N이 홀수일 경우에는 (n+1)/2번째값이 되고, N이 짝수인 경우에는 (n+1)/2와 n/2의 평균값이 된다.

- 극단적인 값의 영향을 받지 않으며, 중위수에 대한 편차의 절대치의 합은 다른 어떤 수에 대한 편차의 절대치의 합보다 작다.

- 분포모양이 대칭일 경우에는 중앙값과 산술평균은 일치한다.

- 분포모양이 비대칭일 경우에는 산술평균이나 최빈수보다 자료의 대표성을 높일 수 있다.

- 경기변동을 산출할 때 사용한다. 제 2사분위수와 동일한 측도이다.

2)최빈수(Mo)

변량 X의 측정값 중에서 출현도수가 가장 많은 값을 의미한다.

중위수와 마찬가지로 자료 가운데 극단적인 이상점에 영향을 받지 않는다.

- 분포모양이 좌우대칭일 때에는 최빈수가 대체로 대표성이 있으며, 최빈수는 전형적인 값이므로 가장 납득하기 쉬운 대푯값이다.

- 가장 쉽게 알아낼 수 있는 대푯값이며, 같은 관측치를 나타내는 관찰대상의 규모 등을 파악하고자 할 때 유용한 대푯값이다.

- 명목수준의 측정에서 사용하는 통계기법이다.

3)산술평균( $\bar$ ), 중위수(Me), 최빈수(Mo)의 관계

좌우대칭 분포일 경우: $\bar$ = Me(중위수) = Mo(최빈수)

좌측 비대칭 분포일 경우: $\bar$ > Me(중위수) > Mo(최빈수)

우측 비대칭 분포일 경우: $\bar$ < Me(중위수) < Mo(최빈수)

산포도(분산도)

자료의 분산 상황을 나타내는 수치로 변량 x와 그 분포 F(x)가 주어졌을 때, 그 분포의 중심적 위치의 척도를 m이라고 할 때, F(x)의 m 주위에 흩어져 있는 정도를 나타내는 기술적 지표이다.

- '분산도'라고도 하며, 크기가 고르지 않은 집단의 특징은 평균 외에 자료의 값이 흩어져 있는 정도를 조사하면 더욱 뚜렷해진다.

- 산포도가 클수록 그 분포의 흩어진 폭이 넓고, 산포도가 작을수록 분포의 흩어진 폭이 좁다.

절대적 분포의 산포도: 범위, 사분위수 범위, 평균편차, 사분편차, 분산&표준편차

상대적 분포의 산포도: 변이계수(변동계수), 사분위편차계수, 평균편차계수

절대적인 분포의 산포도

1)범위(Range)

자료의 분산을 측정하는 가장 간단한 방법으로 자료의 관측치 가운데 가장 큰 최댓값과 최솟값의 차이를 말한다.

범위(R) = 자료의 최댓값 - 자료의 최솟값

- 가장 간단히 구할 수 있는 산포도이며, 표본의 크기가 일정하며 그다지 크지 않은 표본을 다룰 때 매우 편리하다.

- 사용되는 분야는 극히 제한을 받으며 공업적 품질관리 등에서 통계적 기법을 다룰 때 사용된다.

2)사분위수 범위(IQR)

사분위수범위(IQR) = Q3 - Q1

3)평균편차(Mean Deviation) <분산과 다름을 유의>

관측치들의 평균값으로부터 떨어져 있는 거리를 말한다.

평균편차란 평균값에 대한 각 변량의 편차의 절댓값을 평균한 값으로 보통은 산술평균에서의 편차의 절댓값의 평균값을 취하고 있다.

MD = $\frac\sum \left | xi - \bar \right |$

- 절댓값이 포함되어 수학적 처리의 복잡성과 통계적 추론에서 이용도가 낮기 때문에 별로 사용하지 않는다.

- 극단적인 값의 영향은 있으나 분산에 비해 적다는 이유로 사용하기도 한다.

4)사분편차(Quartile Deviation)

Q3에서 Q1을 뺀 값에 1/2값이다. 극단적인 값의 영향을 받지 않으며, 대푯값이 중위수일 때 쓰이는 산포도이다.

- 범위의 극단적인 값의 영향을 받아 불안정함을 개선하기 위하여 고안된 산포도로 주로 변수가 많을 때 사용한다.

사분편차 = (Q3 - Q1) / 2

5)분산과 표준편차

분산이 0이면 모든 변량이 평균값에 집중되고 있음을 의미하며,

분산의 값이 크면 클수록 변량이 평균에서 멀리 떨어져 있다는 것을 의미한다.

상대적인 분포의 산포도

1)변이계수(CV)

표준편차를 산술평균으로 나눈 값을 의미한다.

- 추정통계학에서 표본의 크기를 설정하는 데 많이 쓰인다.

- 평균의 차이가 큰 OR 단위가 다른 두 집단의 산포를 비교할 때 이용한다.

- 변이계수의 값이 큰 분포보다 작은 분포가 상대적으로 평균에 더 밀집되어 있는 분포이다.

CV = S / $\bar$

2)사분위편차계수

사분편차를 중위수로 나는 몫을 사분위편차계수라 한다.

3)평균편차계수

평균편차를 중위수 또는 산술평균으로 나눈 몫을 평균편차계수라고 한다.

비대칭도

왜도

자료분포의 모양이 어느 쪽으로 얼마만큼 기울어져 있는가, 즉 비대칭 정도를 나타내는 척도이다.

왜도가 0이면 대칭분포를 이룬다(정규분포)

왜도가 0보다 크면 왼쪽으로 기울어진 분포이다.

왜도가 0보다 작으면 오른쪽으로 기울어진 분포이다.

왜도의 절댓값이 클수록 비대칭 정도는 커진다.

- 피어슨대칭도( $S_$ )

$S_ = \frac{\bar - M_} \approx \frac- M_)}$

$S_$ 가 0이면 대칭분포를 이룬다

$S_$ 가 0보다 크면 왼쪽으로 기울어진 분포도이다.

$S_$ 가 0보다 작으면 오른쪽으로 기울어진 분포도이다.

-1 < $S_$ < 1

첨도

분포도가 얼마나 중심에 집중되어 있는가, 즉 분포의 중심이 얼마나 뾰족한가를 측정하는 것이다.

첨도 = 3이면 표준정규분포로 중첨이라고 한다.

첨도 > 3이면 정점이 높고 뾰족한 모양으로 급첨이라고 한다.

첨도 < 3이면 낮고 무딘 모양으로 완첨이라고 한다.

첨도의 경우 기출문제에 한번 어렵게 등장한 적이 존재

Q.다음중 첨도가 가장 큰 분포는?

1)표준정규분포

2)평균=0,표준편차=10인정규분포

3)평균=0,표준편차=0.1인정규분포

4)자유도가 1인 t분포

첨도는 기본적으로 표준편차를 기준으로 생각하면 된다.

표준편차가 커지면 첨도도 커지고 표준편차가 작아지면 첨도도 작아지게 됨.

평균에서 뾰족하면(꼬리가 얇으면) 첨도가 작고, 평평해지면(꼬리가 두꺼우면) 첨도가 크게 된다.

문제는 t 분포. t 분포는 자유도에 따라 달라지게 되며, 자유도가 커지면 근사적으로 표준정규분포 근사. 자유도가 1 이면 data 의 수는 2 이므로 표준편차는 상대적으로 매우 커진다.

→ 그러면 거의 균등(균일)분포와 같은 분포 성립.

Uploaded by Notion2Tistory v1.1.0

'Certification_Note > 사조사 2급 - 필기' 카테고리의 다른 글

[사조사2급필기]#6. 사회과학적 방법 (0)	2021.05.08
[사조사필기2급]#03 사회통계 - 통계적 추정 (0)	2021.04.28
[사조사2급필기]#02.사회통계- 확률과 확률분포 (0)	2021.04.21

[SQL-D]#02데이터 모델링의 이해 - 엔터티, 속성, 관계, 식별자, 비식별자

2021. 4. 16. 00:15

엔터티(Entity)

장소, 사람, 물건, 사건, 개념등의 명사, 업무상 관리 필요한 관심사, 저장이 되기 위한 어떤 것(Thing)

업무 활동상 지속적인 관심을 가지고 있어야 하는 대상으로서 그 대상들 간에 동질성을 지닌 인스턴스들이나 그들이 행하는 행위의 집합 → 인스턴스의 집합

엔터티의 특징

업무에서 꼭 필요한 정보 → 반드시 관리되어야하는 정보여야 한다. 유일한 식별자에 의해 식별이 가능해야 함 인스턴스 2개 이상의 집합, Business process에 의해 이용됨 반드시 속성이 있어야 함 (주식별자만 존재하고 일반속성 없어도 적절X, 관계엔터티 예외) 다른 엔터티와의 관계가 최소 1개 이상 존재 (통계성, 코드성, 내부필요 엔터티 예외)

엔터티의 분류

유무형에 따른 분류)

- 유형엔터티(Tangible entity)

물리적인 형태가 있고 안정적이며 지속적으로 활용되는 엔터티로 업무로부터 구분 용이

- 개념엔터티(Conceptual entity)

물리적인 형태는 존재하지 않고 관리해야할 개념적 정보로 구분이 되는 엔터티. ex)조직, 보험상품

- 사건엔터티(Event entity) 업무를 수행함에 따라 발생되는 엔터티로서 비교적 발생량이 많으며 각종 통계자료에 이용.

주문, 청구, 미납 등이 해당

발생시점에 따른 분류)

- 기본엔터티(Basic entity)

그 업무에 원래 존재하는 정보로서 다른 엔터티와 관계에 의해 생성되지 않고 독립적으로 생성이 가능한 엔터티. 자신은 타 엔터티의 부모 역할을 하게 된다.

자신의 고유한 주식별자를 가지게 된다.

- 중심엔터티(Main entity)

기본엔터티로부터 발생되고 그 업무에 있어서 중심적인 역할을 한다.

데이터의 양이 많이 발생되고 다른 엔터티와의 관계를 통해 많은 행위엔터티를 생성. ex) 계약, 사고,

- 행위엔터티

두 개 이상의 부모엔터티로부터 발생되고 자주 내용이 바뀌거나 데이터의 양이 증가된다.

주문목록, 사원변경이력

속성(Attribute)

업무에서 필요로 하는 인스턴스를 관리하고자, 의미상 더이상 분리되지 않는 최소의 데이터 단위

속성의 특징

반드시 해당 업무에서 필요하고 관리하고자하는 정보 정규화 이론에 근간, 정해진 주식별자에 함수적 종속성을 가져야 함 하나의 속성에는 1개의 값만을 가짐. 다중값일 경우 별도의 엔터티 이용하여 분리

속성의 분류

특성에 따른 분류)

- 기본속성

업무로부터 추출한 모든 속성이 여기에 해당하며 가장 일반적이며 많다.

코드성 데이터, 엔터티를 식별하기 위해 부여된 일련번호와 같은 속성을 제외한 모든 속성은 기본속성이다.

- 설계속성

업무상 데이터 이외에 데이터 모델링을 위해, 업무를 규칙화하기 위해 새로 만들거나 정의하는 속성 코드성 속성은 운래 속성을 업무상 필요에 의해 변형하여 만든 설계속성, 일련번호

- 파생속성

다른 속성의 영향을 받아 발생하는 속성으로 보통 계산된 값 등이 해당된다.

프로세스 설계 시 데이터 정합성을 유지하기 위해 유의해야할 점이 많으므로 가급적 적게 정의

구성 방식에 따른 분류)

PK(기본키) / FK(외래키) / 일반속성

도메인(Domain)

각 속성이 가질 수 있는 값의 범위.

엔터티 내에서 속성에 대한 데이터타입/크기/제약사항을 지정하는 것

속성의 명명

해당 업무에서 사용하는 이름 부여 서술식 속성명 사용 X, 약어 사용 가급적 X 전체 데이터 모델에서 유일성 확보하는 것이 좋음

관계(Relationship)

인스턴스 사이의 논리적인 연관성으로서 존재의 형태 or 행위로서 서로에게 연관성이 부여된 상태를 의미한다.

관계와 페어링

관계는 엔터티 안에 인스턴스가 개별적으로 관계를 가지는 것이고 이것의 집합을 관계로 표현.

→ 개별 인스턴스가 각각 다른 종류의 관계를 가진다면 두 엔터티 사이 두개이상의 관계 가능.

관계의 표기법

- 관계차수 - Degree/Cardinality)

1:1 관계)

1:M 관계)

M:M관계)

M:N 관계로 표현된 데이터 모델은 이후에 두 개의 주식별자를 상속받은 관계엔터티를 사용하여 3개의 엔터티로 구분하여 M:N을 해소해야 한다.

- 관계선택사양 - Optionality)

IE 표기법 / Barker 표기법 모두 잘 알고 있어야한다. 매우 헷갈리니 주의

IE 표기법의 경우 선택관계의 대상쪽에 0을 표시하여 확인하고,

Barker 표기법의 경우

관계의 읽기

먼저 관계에 참여하는 기준 엔터티를 하나 또는 각으로 읽고 대상 엔터티의 개수를 읽고 관계선택사양과 관계명을 읽도록 한다.

- 기준(Source)엔터티를 한 개 또는 각으로 읽는다.

- 대상(Target)엔터티의 참여관계도 즉, 개수(하나,하나 이상)을 읽는다.

- 관계선택사양과 관계명을 읽는다.

식별자(Identifier)

엔터티를 구분짓는 논리적인 이름, 엔터티를 대표할 수 있는 속성 엔터티에는 반드시 하나의 유일한 식별자가 존재함

논리 데이터 모델링 단계 → 식별자(Identifier), 물리 데이터 모델링 → 키(Key)

식별자 특징

- 유일성 : 주식별자에 의해 엔터티내에 모든 인스턴스 유일하게 구분함 - 최소성 : 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수여야 함 - 불변성 : 주식별자가 한 번 특정 엔터티에 지정되면 그 식별자 값은 변하지 않아야 함 - 존재성 : 주식별자가 지정되면 반드시 데이터 값이 존재해야 함 (Null X)

식별자 분류

웬만하면 암기하자.

주식별자 도출 기준

- 해당 업무에서 자주 이용되는 속성을 지정

ex) 사원번호 vs 주민번호 → 사원번호 선택

- 명칭, 내역 등과 같이 이름으로 기술되는 것들은 피함

ex) 구분자가 존재하지 않을 경우(부서의 이름 등) 새로운 식별자 생성 (일련번호, 코드 등)

- 복합으로 주식별자 구성할 경우 너무 많은 속성 포함되지 않도록

ex) 주식별자 개수가 많을 경우 새로운 인조식별자를 생성하는 것이 데이터 모델을 한층 더 단순하게 만든다.

식별자와 비식별자 관계

외부식별자의 식별자관계

자식엔터티의 주식별자로 부모의 주식별자가 상속이 되는 경우 → NULL이 오면 안된다.

- 발령엔터티는 반드시 사원엔터티가 있어야 자신도 생성될 수 있고 자신의 주식별자도 부모엔터티의 외부식별자 사원번호와 자신의 속성 발령번호로 이루어져 있음을 알 수 있다. → 1:M 관계

- 사원과 임시직사원의 관계와 주식별자를 보면, 임시직사원의 주식별자는 사원의 주식별자와 동일하게 이용되는 경우를 볼 수 있다. → 1:1 관계

외부식별자의 비식별자 관계

부모로부터 속성을 받아 일반속성으로 사용 (약한 종속) 상속받은 속성 타 엔터티에 차단, 부모쪽 관계참여 선택관계

- 부모 없는 자식 생성 가능한 경우

- 엔터티별로 데이터 생명주기 다르게 관리하는 경우

- 여러개 엔터티가 하나로 통합 표현, 각각 별도의 관계 가질 경우

- 자식 엔터티에서 별도의 주식별자 생성이 더 유리할 경우

계약이 반드시 사원에 의해 이루어져 사원번호와 계약번호를 주식별자로 쓸 수 있지만, 계약번호 단독으로도 계약 엔터티의 주식별자를 구성할 수 있으므로 하나만 가지고 있는 것이 더 효율적이다.

비식별자와 식별자 관계 비교

Uploaded by Notion2Tistory v1.1.0

'Certification_Note > SQL-D' 카테고리의 다른 글

[SQL-D]#06 데이터 모델과 성능 - 파티셔닝 & 분산 데이터 모델 (0)	2021.04.20
[SQL-D]#05 데이터 모델과 성능 - 정규화, 반정규화와 성능 (0)	2021.04.19
[SQL-D]#04 데이터 모델링의 이해 - 물리 데이터 모델링 (1)	2021.04.19
[SQL-D]#03. 데이터 모델링의 이해 - 논리적 모델링 (0)	2021.04.19
[SQL-D]#01 데이터 모델링의 이해 - 모델링, 데이터 모델링, ERD (0)	2021.04.14

[SQL-D]#01 데이터 모델링의 이해 - 모델링, 데이터 모델링, ERD

2021. 4. 14. 22:15

모델링의 이해

- Modeling

일정한 표기법에 의해 규칙을 가지고 표기하는 것,커뮤니케이션 효율성 극대화한 고급화된 표현방법

모델링 특징 3가지

- 추상화

현실세계 일정한 형식에 맞추어 표현 (일정한 양식 표기법)

- 단순화

복잡한 헌실세계 약속된 규약에 의해 제한된 표기법/언어로 표현 쉽게 이해

- 명확화

누구나 이해하기 쉽게 대상의 애매모호함 제거 정확하게 현상을 기술

모델링 관점 3가지

- 데이터 관점 (Data, What) : 업무와 데이터 or 데이터간의 관계

- 프로세스 관점 (Process, How): 업무가 실제 하는 일 or 무엇을 해야 하는지

- 상관 관점 (Interaction): 업무가 처리하는 일의 방법에 따라 데이터가 받는 영향

데이터 모델의 기본 개념의 이해 및 중요성 및 유의점

- Data modeling

정보시스템 구축 위한 데이터 관점 업부 분석기법, 현실세계 데이터를 약속된 표기법에 의해 컴퓨터로 표현, 데이터베이스 구축 위한 분석/설계 과정

기능

시스템 가시화 도움, 구조와 행동 명세화 가능 ,구조화된 틀 제공, 다양한 영역 집중 위해 다른 영역 세부사항 숨김 (다양한 관점 제공)

데이터 모델링 중요성)

파급효과(Leverage): 데이터 구조 변경으로 인한 일련의 변경작업 위험요소 해결

간결한 표현 (Conciseness): 요구사항, 한계 명확하고 간결하게 함으로써 데이터 정합성을 유지한다.

데이터 품질유지 (Data Quality): 오래된 데이터의 정확성, 신뢰성 해결

데이터 모델링 유의점)

중복 (Duplication): 데이터베이스가 여러 장소에 같은 정보 저장하는 것 주의

비유연성 (Inflexibility): 사소한 업무변화에 데이터모델 수시로 변경되면 유지보수 어려움 →

데이터의 정의를 데이터의 사용 프로세스와 분리

비일관성 (Inconsistency) : 데이터의 중복이 없어도 비일관성 발생 가능 → 모델링 할 때 데이터간 상호 연관관계 명확히 정의

데이터 모델링의 3단계

개념적 (추상) → 논리적 → 물리적 (구체)

개념적 데이터 모델링)

조직, 사용자의 데이터 요구사항을 찾고 분석하는데서 시작한다.

ERD 생성

추상화 수준이 높고 업무중심적이고 포괄적인 수준의 모델링 진행, EA 데이터 모델링, 수립시 사용

논리적 데이터 모델링)

DB 설계 프로세스의 Input으로써 비즈니스 정보의 논리적인 구조와 규칙을 명확하게 표현하는 기법

시스템으로 구축하고자 하는 업무에 대해 Key, 속성, 관계 등을 정확하게 표현, 재사용성이 높음

식별자 확정, 정규화, M:M관계 해소, 참조 무결성 규칙

cf) 정규화(Normalization) → 일관성을 확보하고 중복을 제거하여 속성들이 가장 적절한 엔터티에 배치되도록 한다.

대개 현실 프로젝트에서는 개념적 DM과 논리적 DM을한꺼번에 수행함

데이터 독립성

데이터 독립성 필요성

유지보수 비용,데이터 중복성 & 복잡성 증가, 요구사항 대응 저하<과거의 File 시스템>

데이터 독립성 효과

각 View의 독립성 유지, 계층별 View에 영향 주지 않고 변경 가능.

단계별 Schema에 따라 DDL과 DML의가 다름을 제공.

데이터독립성 요소

외부스키마)

View단계 여러 개의 사용자 관점으로 구성, 즉 개개 사용자 단계로서 개개 사용자가 보는 개인적 DB 스키마, DB의 개개 사용자나 응용프로그래머가 접근하는 DB정의

개념스키마)

개념단계, 하나의 개념적 스키마로 구성, 모든 사용자 관점을 통합한 조직 전체의 DB를 기술

통합적 관점, DB에 저장되는 데이터와 그들간의 관계를 표현하는 스키마

내부스키마)

내부단계, 내부 스키마로 구성, DB가 물리적으로 저장된 형식, 물리적 장치에서 데이터가 실제적으로 저장되는 방법을 표현하는 스키마.

DB 스키마 구조 각각은 상호 독립적인 의미를 가지고 고유한 기능을 가진다. 최종적으로 데이터 모델링은 통합관점의 뷰를 가지고 있는 개념 스키마를 만들어가는 과정으로 이해할 수 있다.

- 두 영역의 데이터독립성

논리적 독립성)

개념 스키마가 변경되어도 외부 스키마에는 영향을 미치지 않도록 지원. 논리적 구조의 변경이 응용 프로그램에 영향을 미치지 않게끔 설계

물리적 독립성)

내부스키마가 변경되어도 외부/개념 스키마는 영향을 받지 않도록 지원. 저장장치의 구조변경은 응용프로그램과 개념스키마에 영향을 끼치지 않게끔 설계

ERD(Entity-Relationship Diagram)의 이해

ERD는 각 업무분석에서 도출된 엔터티간의 관계를 이해하기 쉽게 도식화된 다이어그램으로 표시하는 방법으로서 해당 업무에서 데이터의 흐름과 프로세스와의 연관성을 이야하기하는 데 가장 중요한 표기법이자 산출물이다.

ERD작업순서

엔터티를 그린다

엔터티를 적절하게 배치

엔터티간 관계를 설정한다.

관계명을 기술

관계의 참여도를 기술한다.

관계의 필수여부를 기술한다.

좋은 데이터 모델의 요소

- 완전성(Completeness)

업무에 필요한 모든 데이터가 데이터 모델에 정의되어 있어야한다.

- 중복배제(Non-Redundancy)

하나의 DB내에 동일한 사실은 한 번만 기록하여야 한다. EX)하나의 테이블에 '나이' & '생년월일'

- 업무규칙(Business-rule)

업무규칙에 따라 데이터모델은 얼마든지 바뀔 수 있다.

- 데이터 재사용(Data Reusability)

데이터의 재사용성은 기업에 많은 이익을 가져다준다. 독립적 설계 → 재사용성 증대

- 의사소통(Comuunication)

여러 이해관계자들이 설계자가 정의한 업무 규칙들을 동일한 의미로 받아들이고 정보시스템 활용

- 통합성(Integrity)

Uploaded by Notion2Tistory v1.1.0

'Certification_Note > SQL-D' 카테고리의 다른 글

[SQL-D]#06 데이터 모델과 성능 - 파티셔닝 & 분산 데이터 모델 (0)	2021.04.20
[SQL-D]#05 데이터 모델과 성능 - 정규화, 반정규화와 성능 (0)	2021.04.19
[SQL-D]#04 데이터 모델링의 이해 - 물리 데이터 모델링 (1)	2021.04.19
[SQL-D]#03. 데이터 모델링의 이해 - 논리적 모델링 (0)	2021.04.19
[SQL-D]#02데이터 모델링의 이해 - 엔터티, 속성, 관계, 식별자, 비식별자 (1)	2021.04.16

2021 정보처리기사 필기 - 합격후기, 교재, 공부법(feat.독학VS인강)

2021. 3. 29. 21:27

안녕하세요 여러분, 처음으로 글을 써보네요.

이번 21년도 기사 1회 시험 - 정보처리기사 필기후기를 작성하기 위해 글을 써봅니다.

정보처리기사는 대학교 4학년인 제가 처음 쳐보는 자격증 시험이였는데요. 그만큼 많이 떨렸던 것 같습니다.

저는 경영대학 소속이면서 AI전공을 이수해서 아는 내용도 적당히 섞여있었던 것 같습니다. (애매한 전공자 느낌...?)

이번 시간에는 합격후기와 함께 제가 한 공부법과 더불어 정리한 노트의 일부분을 여러분께 공유해드리려고 합니다.

제가 공부하는 방식을 한번 살펴보고 유사하게 혹은 자신의 스타일에 맞게 하면 좋을 것 같아욥!

* 2021 정보처리기사 필기 합격

이번 21년도 1차 정보처리기사는 생각보다 쉽게 출제되었습니다.

여러 커뮤니티에서 떠돌아다니는 합격률을 보더라도 약 82%의 합격률을 보이는 것으로 나타나는데요.

커뮤니티에서도 또 한번의 전설을 썼다는 평이 많은 것 같네요. 출제기관에서 난이도 조절에 실패했다고 보는 게 맞는 것 같습니다. 보통 이럴경우 실기가 비교적 어렵게 나온다고 해서 벌써부터 걱정이 되는 것 같네요.

정보처리기사의 경우에는 필기는 보통 60~70%, 실기는 20년 기준 17%의 합격률을 보이고 있습니다.

* 준비기간, 독학 VS 인강

준비기간 - 3주

저 같은 경우에는 이번 정보처리기사 합격을 위해 3주의 기간을 소요했습니다.

프로그래밍과 같은 부분들은 대학에서 전공수업을 들었기 때문에 조금은 편하게 공부할 수 있었습니다. 제 생각에

전공자는 3주(약간 타이트) ~ 4주(넉넉), 비전공자는 5주(적당) ~ 6주(넉넉) 정도로 잡으시면 좋을 것 같아요.

무작정 기간을 오래 잡아 놓으면 생활루틴 또한 넉넉해지기 때문에 약간은 타이트하게 잡으시고 빡공하시는 것을 추천드립니다. ~~(필자의 경우 기간을 넉넉하게 잡으면 결국에 타이트해질때까지 아무것도 하지 않습니다)~~

독학 VS 인강

독학VS인강의 경우에는 무조건 독학을 추천합니다.

저도 처음 준비할때는 지레 겁먹고 인강을 들으려고 했는데 솔직히 말씀드려 정말 비추천합니다.

정처기 인강의 경우 보통 강의수가 엄청 많습니다.(80강~100강짜리도 본 것 같아요) 이걸 다 듣는데 아무리 빨라도 2주는 걸릴 것 같더라구요. 그리고 강의를 듣게 되면 진도가 루즈해지는 경우가 허다합니다.

사실 정보처리기사 필기와 같은 경우에는 고도의 어려운 문제들은 나오지 않는다고 생각합니다. 암기와 이해의 영역이지 응용,고도의 문제가 나오지는 않아요. 3,4과목의 SQL, 프로그래밍 언어와 같은 경우에도 유튜브 강의를 보시거나 여러 블로그에 포스팅된 글들을 보시면 어렵지 않게 이해하실 수 있는 정도입니다.

사실 대학생의 입장에서 인강을 구매하는 것은 실로 큰 부담이며, 그정도의 어려운 난이도는 아니라고 생각합니다.

무조건 다독하시고, 정리하시고, 문제를 풀면 합격선에 가까워질 것이라고 생각합니다.

* 교재 - 시나공

교재는 시나공 2021 정보처리기사 필기세트를 선택했습니다.

많은 분들이 교재에 대한 고민을 하시던데, 저같은 경우에는 그냥 다 거기서 거기겠지 하고 시나공을 선택했는데 나쁘지 않았던 것 같아요.

네이버 책: '시나공 정보처리기사 필기' 검색결과

책으로 만나는 새로운 세상

book.naver.com

시나공의 경우에는 중요도별 A,B,C,D로 구분이 되어있어 보기에는 편했던 것 같습니다.

문제 같은 경우에는 이전 기출문제만 보고 시나공 자체에서 만든 문제는 풀지 않았어요.(최종모의고사는 꼭 봐야합니다)

~~사실문제의 퀄이 그렇게 좋지 않았어요.~~

처음에는 다 짚고 넘어가자는 생각에 문제를 풀었는데 풀수록 굳이?라는 생각이 들어서 안 풀었는데 잘한 것 같습니다.

최종모의고사같은 경우에는 풀면서 20년도 기출과 유사하다는 느낌을 많이 받아서 유용했습니다.

실제 21년도 1차같은 경우에도 유사한 난이도로 나왔기에 최종모의고사는 강추드리는 바입니다.

타 교재와의 비교

사실 이기적, 수제비와의 비교가 불가능한 것이 다른 교재를 한번도 본 적이 없기 때문입니다.

여러 커뮤니티에서 사용하시는 비율을 따져보면 수제비 50%, 시나공 30%, 이기적 20%정도라고 생각됩니다.

생각보다 수제비를 보시는 분들이 너무 많으셔서 저도 이번 실기책으로는 수제비를 선택했는데요.

완독한 후 두가지를 비교해보는 글도 가능하다면 써볼 수 있도록 하겠습니다.

제가 생각하는 베스트는 (시간이 많지 않으신 분들 용)

우선 개정이후의 기출, 시나공에서 정리해준 20년도 이전 관련 기출만 푸시고 자체 출제예상 문제는 그냥 풀지 마시길 바랍니다. 1회독을 다 돌리신 후에 풀어나가도 늦지 않아요!

* 정보처리기사 필기 공부법

저는 우선 시나공 교재에 나와있는 A,B 유형에 대한 1회독을 진행했습니다.<이부분이 가장 중요합니다>

1회독을 하는 과정에서 노션에 정리를 하면서 진행했어요.

사실 정보처리기사의 경우에는 단원별 유닛이 독립적인 경우가 많아 공부하기 편했습니다.

-> 중요도 A,B만 공부하더라도 나중에 C,D와 관련된 내용이 나오지 않기 때문에 분리 공부가 가능해요!

노션에다가 아래와 같이 과목별 큰 흐름을 잡아놓고 장별 내용사항을 헷갈리지 않도록 주의했습니다.

사실 이건 필기때보다는 실기때 더 중요할 것 같습니다. 실기의 경우에는 과목별 구분이 이루어지지않고,

문제를 잘못이해할 경우 전혀 다른 답을 내놓을 수 있기때문에 필기때문에 의식적으로 기억하려고 노력했습니다.

사실 1회독을 진행할 때 위와같이 모든 내용을 정리하게 되면 굉장히 힘에 부치지만 한번 정리해놓으면 계속해서 참고해서 볼 수 있다는 장점이 있습니다. 또한 시험이 몇일 안남았을때 쭈르륵 보면서 제가 약한 부분들만 따로 정리하기가 매우 편해서 좋았어요.

시간이 충분하다면 새로 한번 적어보는 것도 좋습니다. 저의 경우에는 고사장에 가는데만 1시간이여서 가는동안 참고하려고 이전 글들을 복붙해서 제가 약한 부분만 따로 모아놨습니다.

~~최종 정리노트에서 본 것 중에 포기했던 3문제가 시험에 나와 다 맞첬습니다ㅎㅎ(역시 시험은 운빨게임)~~

저는 공부를 항상 쓰면서 하는 편인데 시간이 촉박해짐에 따라 지금은 컴퓨터 프로그램 노션으로 정리하고 관리하고 있어요! 저처럼 쓰면서 공부하시는 분들은 노션(Notion)과 같은 플랫폼을 이용하시는 것도 좋을 거라 생각합니다.

- 혹시나 노션 사용을 어떻게해야할지 모르겠다는 분들 계실 것 같아 한 파트를 PDF내보내기를 통해 가져왔습니다.

지극히 제위주의 정리법이니 이걸 베이스로 본인들만의 정리법을 만들면 좋을 것 같습니다.

5단원 2장. IT프로젝트 정보 시스템

0.58MB

이렇게 1회독을 끝내고 나면 거시적인 내용들은 대부분 기억이 나는 상태입니다. 하지만 이상태는 휘발성이 엄청 높은 상태기 때문에 꾸준히 다독을 해줘야 합니다.

저는 1회독 후에는 외울게 많은 부분, 어려워했던 부분들을 위주로 공책에 막 쓰면서 공부했어요. 노션에 깔끔한 정리가 있으니 이쁘게 적을 필요가 없다고 생각해서 막 갈겨적었습니다 ㅎㅎㅎ

이번시간에는 21년도 정보처리기사 후기 - 준비기간, 독학&인강, 그리고 교재에 대해서 알아봤습니다.

다들 감사합니다.

'Certification_Review > Success_Review' 카테고리의 다른 글

2021 데이터아키텍처준전문가(DASP) - 합격후기, 합격률, 교재, 공부법(feat. 매우상세) (0)	2021.04.26

PREV 1 2 NEXT

비전공자의 디지털 & 금융 도전기