본문 바로가기

빅데이터

(2)

빅데이터 플랫폼 Spark 개요 오늘은 최근 몇 년 동안 큰 인기를 얻고 있는 강력한 오픈소스 데이터 처리 엔진인 Apache Spark에 대해 자세히 살펴보려고 합니다. 이 블로그 게시물에서는 Spark의 역사, 장단점, 몇 가지 실제 사용 사례에 대해 살펴보겠습니다. Spark의 간략한 역사 아파치 스파크는 2009년 캘리포니아 대학교 버클리 캠퍼스 AMPLab의 연구 프로젝트에서 탄생했습니다. 느린 반복 처리와 대화형 데이터 분석에 대한 지원 부족과 같은 Hadoop의 MapReduce 프로그래밍 모델의 몇 가지 한계를 해결하기 위해 만들어졌습니다. Spark는 MapReduce보다 더 빠르고, 더 유연하고, 더 쉽게 사용할 수 있도록 설계되었습니다. 2013년에 Apache Software Foundation의 프로젝트가 되었으..

빅데이터 기술의 역사 저는 업무의 일환으로 정기적으로 방대한 양의 데이터를 다루고 있으며, 빅데이터 분석 기술의 역사와 발전에 항상 매료되어 왔습니다. 오늘 블로그 포스팅에서는 이 분야의 발전 과정을 살펴보기 위해 시간 여행을 떠나보겠습니다. 초창기: 1960년대 - 1980년대 빅 데이터 분석의 역사는 최초의 대규모 전자 데이터 저장 시스템이 개발된 1960년대로 거슬러 올라갑니다. 이 시기는 메인프레임 컴퓨터의 등장으로 조직에서 처음으로 대량의 데이터를 저장하고 처리할 수 있게 된 시기였습니다. 그러나 오늘날 우리가 알고 있는 빅 데이터 분석의 개념은 관계형 데이터베이스와 SQL 언어가 널리 보급된 1980년대에 이르러서야 본격적으로 등장했습니다. 데이터 웨어하우징의 탄생: 1990s 1990년대에 데이터 웨어하우징은 계..

이전 1 다음

티스토리툴바