데이터와 정보
데이터(Data)
- 존재적 특성 : 추론과 추정의 근거를 이루는 객관적 사실
- ADsP 에서는 이것을 데이터라고 함
- 원본 데이터(Raw Data)라고도 한다.
- 당위적 특성 :추론, 예측, 전망, 추정을 위한 근거를 의미
데이터 유형
- 형태에 따른 구분
- 정성 데이터(Qualitative Data) : 언어, 문자로 표현
- 정량 데이터(Quantitative Data) : 수치, 도형, 기호등으로 표현
- 구조에 따른구분
- 정형 데이터 (Structured Data) : 표 형태등 고정된 틀에 맞게 입력된 데이터
- 비정형 데이터 (Unstructured Data) : 이미지, 텍스트등 고정된 틀을 적용하기 어려운 데이터
- 데이터 기술과 알고리즘 발달로 분석 난이도가 낮아지고 있다.
- 경계가 불분명하고 모호한 경우도 존재
지식 경영과 데이터
- 암묵지(Tactic Knowledge)
- 개인에게 습득되어 있지만 밖으로는 드러나지 않는 지식
- 형식지(Explict Knowledge)
- 문서, 영상등으로 형상화 되어 전달과 공유가 용이한 지식
- 지식의 순환
- 암묵지와 형식지가 상호작용하는 형태
- 표출화(Externaliztaion) : 개인의 지식을 언어나 기호, 숫자 등의 형태를 가진 데이터로 표현
- 연결화(COmbination) : 상대의 표출화된 지식을 본인의 지식에 연결
- 내면화(Internalization) : 축적도니 경험 및 데이터를 바탕으로 지식을 습득
- 공동화(Socialization) : 조직의 구성원이 동일한 지식을 공유
DIKW 피라미드
: 자주 혼용되는 데이터, 정보, 지식과 지혜를 계층적인 구조로 설명하는 모형
- 데이터(Data) : 수치나 기호, 문자로 표현된 기록 그 자체를 의미
- 정보(Information) : 목적에 따라 데이터를 가공, 처리, 분석한 결과물
- 지식(Knowledge) : 정보를 연결하고 일반화한 체계적이고 가치 있는 사실
- 지혜(Wisdom) : 축적된 지식과 경험 및 아이디어를 결합한 창의적인 산물
데이터베이스
- 데이터베이스의 정의
- 특정한 목적을 위해 수집한 데이터를 여러 사람이 공유하기 위해 효율적으로 통합 관리되는 정보의 집합
- DBMS → 데이터베이스를 구축하고 츄지, 관리할 수 있는 소프트웨어
- 데이터베이스의 특징
- 통합된 데이터 : 데이터 중복 X
- 저장된 데이터 : 컴퓨터가 접근할 수 있는 저장 매체에 저장
- 공용 데이터 : 여러 사용자가 다른 목적으로 데이터를 공동 사용 가능
- 변화되는 데이터 : 항상 변화하지만 각 시점에서 정확한 데이터를 유지
- 데이터 베이스의 활용
- 기업 내부 DB
- 기업 경영에 관한 모든 데이터를 연계하여 일관된 체게로 구축
- 다양한 부문에 걸쳐 도입 및 확장
- DBMS 관련 용어
- OLTP (OnLine Transaction Processing)
- DW (Data Warehouse)
- 다양한 출처에서 데이터를 통합하여 저장하는 중앙 저장소
- 중앙 집중식 데이터 관리가 특징
- DM (Data Mart)
- DLAP (OnLine Analytical Processing)
- 저장된 대용량 데이털ㄹ 다양한 방법으로 분석하여 의사결정에 도움을 주는 시스템
- 데이터 처리 및 분석 흐름
- 데이터베이스 활용 전략 용어
- ERP (Enterprise Resource Planning)
- 기업의 모든 자원과 프로세스를 통합적으로 관리하는 시스템
- 경영정보시스템 (MIS)
- 생산성과 수익성을 높이기 위해 정보를 수집, 가공, 축적후 구성원에게 공유하는 시스템
- CRM (고객 경험 관리)
- 고객 만족도와 충성도를 높이기 위해서 고객 데이터를 수집 분석
- RM (Risk Management)
- 계약 및 거래의 연체를 관리하기 위해 위험을 수치화하여 최소화하거나 제어하기 위한 일련의 과정
- SCM (공급망 관리)
- BI (비지니스 인텔리전스)
- 데이터를 분석하여 유용한 정보를 도출, 데이터 시각화와 대시보드로 표현
빅데이터의 이해
- 빅데이터 정의 및 특성
- 규모 중심 정의
- 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터
- 분석 비용 및 기술 초점 정의
- 다양한 종류의 대규모 데이터로부터 적은 비용으로 가치를 추출하고 분석을 지원한 기술 및 아키텍처
- 빅데이터의 특성 : 3V
- Volume (크기) : 데이터의 용량, 물리적인 크기가 커지고 있다.
- Variety (다양성) : 다양한 유형의 데이터가 생성, 저장되고 있다.
- Velocity (속도) : 수집의 처리, 활용 과정에서 속도가 빨라지고 주기가 단축되고 있다.
- 빅데이터의 출현 배경