분산 데이터베이스 시스템은 대부분의 비즈니스와 소프트웨어 애플리케이션에서 필수 요소다. 애플리케이션은 로직과 사용자 인터페이스를 제공하고 데이터베이스 시스템은 데이터의 무결성과 일관성을 보장하고 데이터를 이중화한다.
2000년에만 해도 데이터베이스의 종류가 다양하지 않아 대부분 관계형 데이터베이스였으며, 시스템 간에 큰 차이가 없었다. 그렇다고 모든 데이터베이스가 완전히 같지는 않았지만 기능과 적용 사례가 무척 비슷했다.
감마 데이터베이스 머신 프로젝트(Gamma Database Machine Project), 테라데이터(Teradata), 그린플럼(Greenplum), 패러렐 DB2(Parallel DB2) 등의 데이터베이스는 여러 데이터베이스 인스턴스를 하나의 논리적 단위로 수행해 시스템의 성능과 용량을 높이는 수평 확장(horizontal scaling, scale out)을 지원한다. 수평 확장성은 고객들이 데이터베이스에서 가장 필요로 하는 속성이다. 클라우드 기반 서비스에 대한 수요가 높아지는 현상이 이를 증명한다. 데이터베이스를 더 크고 강력한 서버로 옮기는 수직 확장(scale up)보다 새로운 인스턴스를 클러스터에 추가하는 방식의 수평 확장이 더 쉽다. 마이그레이션(migration)은 길고 어려운 작업이며 다운타임이 불가피할 수 있다.
2010년 무렵 결과적 일관성(eventually consistent) 모델 기반의 데이터베이스가 등장했고 NoSQL과 빅데이터와 같은 용어가 인기를 얻기 시작했다. 지난 15년 동안 오픈소스 커뮤니티와 거대 IT 기업, 데이터베이스 개발사는 수많은 데이터베이스와 툴을 개발해왔다. 이들의 사용 사례와 세부 구현, 특징을 모두 이해하는 것은 불가능에 가깝다.
2007년에 아마존이 발표한 다이나모(Dynamo) 논문은 데이터베이스 커뮤니티에 큰 파장을 일으켜 단기간에 이를 기반으로 한 여러 변형 시스템이 만들어졌다. 대표적으로 페이스북의 아파치 카산드라(Apache Cassandra)와 링크드인의 프로젝트 볼드모트(Project Voldemort), 전 아카마이 엔지니어들이 개발한 리악(Riak) 등이 있다.
데이터베이스 분야는 또 한 번 새로운 변화를 맞이하고 있다. 키-값 스토어와 NoSQL, 결과적 일관성 모델 이후 더 높은 확장성과 성능을 제공하면서 복잡한 쿼리를 수행하고 강력한 일관성을 보장하는 데이터베이스가 나오고 있다.