빅데이터란?
- 데이터 규모에 맞춘 정의 : 기존 데이터베이스 관리 도구의 데이터 수집, 저장, 관리, 분석하는 역량을 넘어서는 데이터
- 업무 수행 방식에 맞춘 정의 : '다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고, 데이터의 빠른 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍쳐' 라고 하는데 가트너 발표 2015년에 빅데이터 항목이 사라졌다. ( 병각이 형이 늘 말씀하셨지)
그 이유로 가트너에서는 '빅데이터는 하나의 기술 트랜드나 프로젝트가 아닌 IT전체에 녹아 있는 공기와 같은 기술이기 때문' 이라고 했다.
빅데이터를 공부하고 여러 자료를 읽어보면서 생각한건 엄청나게 데이터가 발생하고 그 데이터를 분석하는 것은 좋지만 이를 어떻게 활용할 것인가가 중요한 이슈라고 생각한다. 사업에 있어 choice가 몇몇의 가능성을 더한 것이 었다면 이젠 뒷받침할 근거를 제공할 수 있도록 데이터를 활용할 수 있다는 것이다.
Data Scientist는 Data Engineer와 Data Analysis로 분화되어 가고 있다.
어떻게 준비할 것인가에 대해 조금 더 고민해 볼 가치가 있는 듯 하다.
'Data Engineer > Hadoop' 카테고리의 다른 글
하둡 2.0 구성요소 and 동작방식 (0) | 2016.05.04 |
---|---|
하둡 1.0 vs 하둡 2.0 (0) | 2016.05.04 |
하둡(Hadoop)이란? (0) | 2016.05.04 |