빅데이터란?


- 데이터 규모에 맞춘 정의 : 기존 데이터베이스 관리 도구의 데이터 수집, 저장, 관리, 분석하는 역량을 넘어서는 데이터

- 업무 수행 방식에 맞춘 정의 : '다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고, 데이터의 빠른 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍쳐' 라고 하는데 가트너 발표 2015년에 빅데이터 항목이 사라졌다. ( 병각이 형이 늘 말씀하셨지)

그 이유로 가트너에서는 '빅데이터는 하나의 기술 트랜드나 프로젝트가 아닌 IT전체에 녹아 있는 공기와 같은 기술이기 때문' 이라고 했다. 

빅데이터를 공부하고 여러 자료를 읽어보면서 생각한건 엄청나게 데이터가 발생하고 그 데이터를 분석하는 것은 좋지만 이를 어떻게 활용할 것인가가 중요한 이슈라고 생각한다. 사업에 있어 choice가 몇몇의 가능성을 더한 것이 었다면 이젠 뒷받침할 근거를 제공할 수 있도록 데이터를 활용할 수 있다는 것이다.

Data Scientist는 Data Engineer와 Data Analysis로 분화되어 가고 있다. 
어떻게 준비할 것인가에 대해 조금 더 고민해 볼 가치가 있는 듯 하다.

'Data Engineer > Hadoop' 카테고리의 다른 글

하둡 2.0 구성요소 and 동작방식  (0) 2016.05.04
하둡 1.0 vs 하둡 2.0  (0) 2016.05.04
하둡(Hadoop)이란?  (0) 2016.05.04

+ Recent posts