1. 빅데이터의 정의
- 일반적 DB 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 (맥킨지, 2011)
- 다양한 대규모 데이터로부터 저렴한 비용으로 가치 추출, 수집, 발굴, 분석 지원하도록 고안된 차세대 기술 및 아키텍쳐 (IDC, 2011)
- 대용량 데이터로 작은 용량에서는 얻을 수 없었던 새로운 통찰이나 가치를 추출해내는 일 (메이어-쇤베르거와쿠키어, 2013)
- 빅데이터의 3V : Volume(양 - 규모 측면), Variety(다양성 - 유형 측면), Velocity(속도 - 수집 및 처리 측면)
- 3가지 관점에 따른 빅데이터의 정의
- 좁은 범위 : 데이터 특성 변화 초점 (3V)
- 중간 범위 : 처리, 분석 기술적 변화 포함 (새로운 데이터 처리, 저장, 분석 기술 및 아키텍쳐, 클라우드 컴퓨팅 활용)
- 넓은 범위 : 인재, 조직 변화 포함 (data scientist 인재 필요, 데이터 중심 조직)
2. 빅데이터 출현 배경
- 빅데이터 현상 : 새로운 것이 아니라, 기존 데이터, 처리방식, 다루는 사람과 조직 차원에서 일어나는 변화
- 산업계) 고객 데이터 축적(양질 전환 법칙)
- 학계) 거대 데이터 활용 과학 확산(ex: 인간 게놈 프로젝트) → 필요 기술 아키텍처 및 통계 도구 발전 - 관련 기술 발전 : 디지털화, 저장 기술 발전 및 가격 하락, 인터넷 보급, 모바일 혁명, 클라우드 컴퓨팅 보편화
- 출현에 따른 변화
- 사용자 로그 정보(인터넷 접속 시간, 정보, 검색기록 등) 대한 프로파일링 이루어짐
- 사용자와 광고 매칭하는 정확도 향상
- SNS, GPS, 가속센서, 거리센서 등으로 사용자 상황 정보 파악
3. 빅데이터의 기능
- 산업혁명의 석탄, 철 : 제조업 및 서비스 분야 생산성 끌어올려 사회, 경제, 문화, 생활 전반에 혁명적 변화 가져올 것으로 기대
- 21세기의 원유 : 경제 성장에 필요한 정보 제공하여 산업 전반의 생산성 한단계 향상, 기존에 없던 새로운 범주의 산업 만들어낼 것
- 렌즈 : 현미경이 생물학에 영향 미친 것처럼 산업 발전에 영향을 미칠 것 (구글 Ngram Viewer)
- 플랫폼 : 공동 활용 목적으로 구축된 유무형의 구조물 역할을 할 것
4. 빅데이터가 만들어 내는 본질적인 변화
- 사전처리 → 사후처리 : 가능한 한 많은 데이터 모으고 다양한 방식으로 조합해서 숨은 정보 찾아냄
- 표본조사 → 전수조사 : 클라우드 컴퓨팅 등으로 데이터 수집 및 처리비용이 감소되어 전수조사가 가능해질 것
- 질 → 양 : 데이터 지속 추가 시 양질의 정보가 많아져 전체적으로 좋은 결과 산출
- 인과관계 → 상관관계 : 상관관계 통해 특정 현상 발생 가능성이 포착되고 그에 상응하는 행동을 하도록 추천
출처 : ADsP 데이터 분석 준전문가 (윤종식 저)
반응형
'DATA SCIENCE > ADSP' 카테고리의 다른 글
[ADsP] 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 (0) | 2020.06.03 |
---|---|
[ADsP] 1-2. 데이터의 가치와 미래 (2) 빅데이터 가치와 영향 (0) | 2020.06.03 |
[ADsP] 1-1. 데이터의 이해 (3) 데이터베이스 활용 (0) | 2020.06.02 |
[ADsP] 1-1. 데이터의 이해 (2) 데이터베이스 기초 (0) | 2020.06.02 |
[ADsP] 1-1. 데이터의 이해 (1) 데이터 기초 (0) | 2020.06.02 |