Apache Cassandra è un sistema di database distribuito open source progettato per archiviare e gestire grandi quantità di dati su commodity server. Cassandra può fungere sia da archivio di dati operativi in tempo reale per applicazioni transazionali online sia da database ad alta intensità di lettura per sistemi di business intelligence (BI) su larga scala.
Creata originariamente per Facebook, Cassandra è progettata per avere nodi simmetrici peer-to-peer, invece di nodi master o con nome, per garantire che non possa mai esserci un singolo punto di errore (SPoF). Cassandra partiziona automaticamente i dati su tutti i nodi del cluster di database, ma l'amministratore ha il potere di determinare quali dati verranno replicati e quante copie dei dati verranno create.
Dopo che Facebook ha reso il codice open source, Cassandra è diventata un progetto Apache Incubator nel 2008 e un progetto Apache di alto livello nel 2010. Al momento della stesura di questo documento, le distribuzioni di Cassandra includono Netflix, Digg, Adobe, Twitter, HP, IBM, Rackspace, Cisco e Reddit.
Il nome Cassandra è stato ispirato dalla bellissima mistica veggente della mitologia greca le cui previsioni per il futuro non sono mai state credute.
Questo tutorial di DataStax fornisce un'eccellente panoramica di Cassandra: