빅데이터의 특징으로 거론되는 큰 3가지 내용으로는
Volume : 데이터의 규모
일단 빅데이터는 대용량이다.
페이스북이 하둡(Hadoop) 데이터베이스에 저장하는 사진문서 용량은 30페타바이트(대략 30,000TB)에 이른다.
그리고 뉴욕 증권거래소는 매일같이 1TB에 해당하는 데이터를 쏟아낸다고 한다.
Velocity : 데이터의 생성 속도
데이터가 빠른 속도로 생성되기 때문에 적시에 유용한 정보를 뽑아내기 위해서는 속도가 빨라야 한다.
Variety : 데이터의 다양성
- 구조화 데이터 : 테이블에 저장 할 수 있는 정형화된 데이터
- 비구조화 데이터 : 영상, 이미지 등…
V3에서 2개의 개념을 더해서 V5로 특징이 정의되기도 한다
Veracity : 정확성
표본이 크므로 정확도가 높다.
Value : 가치
빅 데이터 분석을 통해 도출된 결론은 기업이나 조직의 당면한 문제를 해결할 수 있어야 하며 통찰력 있는 유용한 정보를 제공해야 한다.
'HADOOP' 카테고리의 다른 글
빅데이터란? 빅데이터의 정의 (0) | 2018.08.07 |
---|