이 포스팅은 데이터에듀의 2021 빅데이터분석기사 필기를 정리해놓은 것으로,
만약 문제가 된다면 내리도록 하겠습니다.
데이터는 객관적 사실으로서의 존재적 특성과, 추론, 예측, 전망, 추정을 위한 근거로서의 당위적 특성을 가지고 있다.
데이터의 유형
- 정성적 데이터
- 정량적 데이터
정성적 데이터는 언어, 문자 등 비정형 데이터를 의미한다.
주관적인 내용의 형태를 띈다.
이러한 정성적 데이터는 저장, 검색, 분석에 많은 비용이 소모된다. 또한 통계 분석이 어렵다는 특징이 있다.
정량적 데이터는 수치, 도형, 기호 등의 정형데이터를 의미하는데, 주로 객관적 내용이 해당한다.
정량적 데이터는 정형화된 데이터로 비용 소모가 적고, 통계분석이 용이하다.
지식경영
지식경영이란?
기업의 생존과 경쟁력 확보가 인적자원의 지식에 달려있다고 보고 기업이 구성원 개개인이 가진 지식의 공유를 통해 기업의 문제해결 능력을 향상시키려는 경영방식을 말한다.
왜 지식경영 얘기가 나왔냐하면,
데이터가 이 지식경영의 핵심적인 역할을 하기 때문이다.
암묵지는 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로는 드러나지 않는 지식을 의미한다.
형식지는 문서나 매뉴얼처럼 형상화된 지식이다.
결국 암묵지는 조직의 지식으로 공통화되고, 형식지는 개인의 지식으로 연결화 되는 것이다.
데이터와 지식의 관계
DIKW 를 들어본적이 있는가?
나는 이번에 처음 봤다. 각각
Data
Information
Knowledge
Wisdom
을 의미한다고 한다.
이는 순서와도 같다. 점점 갈수록 의미가 있어진다.
Data -> Information -> Knowledge -> Wisdom
데이터베이스
1차적인 개념으로 데이터베이스를 정의내려보자.
체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물.
소재를 체계적으로 배열 또는 구성한 편집물로서 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것
2차적인 개념으로 데이터베이스를 정의한다면?
동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합
데이터베이스의 특징은 아래와 같다.
통합된 데이터 : 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미. 데이터 중복은 관리상의 복잡한 부작용을 초래.
저장된 데이터 : 자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장매체에 저장되는 것을 의미. 데이터베이스는 기본적으로 컴퓨터 기술을 바탕으로 한 것.
공용 데이터: 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미. 대용량화되고 구조가 복잡한 것이 보통.
변화되는 데이터 : 데이터베이스에 저장된 내용은 곧 데이터베이스의 현 시점에서의 상태를 나타냄. 다만 이 상태는 새로운 데이터의 삽입, 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야함.
이 박에도 정보의 축적 및 전달 측면, 정보 이용측면, 정보관리 측면, 정보 기술 발전 측면, 경제산업 측면이 있다.
'Archive > Develop' 카테고리의 다른 글
[ 정규표현식 ] 정규표현식 IPv4 | 정규표현식 아이피 정보 (0) | 2021.09.28 |
---|---|
[ 정규표현식 ] 정규표현식 16진수 | 예시로 알아보는 정규표현식 기초 (0) | 2021.09.28 |
[ Windows Socket ] 소켓 프로그래밍/소켓 통신 예제 간단한 채팅 프로그램 (4) | 2021.09.17 |
[ Django ] SNS 서비스에 태그 기능을 추가해보자! | django taggit 설치/사용법 (2) (2) | 2021.09.01 |
[ Django ] SNS 서비스에 태그 기능을 추가해보자! | django taggit 설치/사용법 (1) (0) | 2021.09.01 |