스탭코딩



빅데이터의 특징으로 거론되는 큰 3가지 내용으로는



Volume : 이터의 규모 

일단 빅데이터는 대용량이다. 

페이스북이 하둡(Hadoop) 데이터베이스에 저장하는 사진문서 용량은 30페타바이트(대략 30,000TB)에 이른다. 

그리고 뉴욕 증권거래소는 매일같이 1TB에 해당하는 데이터를 쏟아낸다고 한다.



Velocity : 데이터의 생성 속도


데이터가 빠른 속도로 생성되기 때문에 적시에 유용한 정보를 뽑아내기 위해서는 속도가 빨라야 한다.



Variety : 데이터의 다양성 


- 구조화 데이터 : 테이블에 저장 할 수 있는 정형화된 데이터
-
비구조화 데이터 : 영상, 이미지 등





V3에서 2개의 개념을 더해서 V5로 특징이 정의되기도 한다



Veracity : 정확성


표본이 크므로 정확도가 높다.



Value : 가치


빅 데이터 분석을 통해 도출된 결론은 기업이나 조직의 당면한 문제를 해결할 수 있어야 하며 통찰력 있는 유용한 정보를 제공해야 한다.





'HADOOP' 카테고리의 다른 글

빅데이터란? 빅데이터의 정의  (0) 2018.08.07



빅데이터를 규모면에서 정의 한다면 


'기존 데이터베이스 관리도의 데이터 수입, 저장, 관리, 분석하는 역량을 넘어서는 데이터'


업무수행박식면에서 정의 한다면


'다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출데이터의 빠른 수집발굴 분석을 지원하도록 고안된 차세대 기술 및 아키텍처'


로 볼 수 있다.


또는 


'서버 한 대로는 처리할 수 없는 규모, 기존의 소프트웨어(DBMS )로 처리할 수 없는 규모의 데이터'


로 정의되기도 한다.





'HADOOP' 카테고리의 다른 글

빅데이터란? 빅데이터의 특징  (0) 2018.08.07