NoSQL Cassandra

Apache CassandraBasis data NoSQL Cassandra dapat menangani data dalam jumlah yang besar (Big Data). Cassandra secara otomatis mereplikasi Data ke simpul (node) yang mendukung replikasi di beberapa pusat data yang terkait. Dengan arsitektur desentralisasi seperti ini risiko kegagalan penyimpanan data dapat meminimalkan secara default.

Apache Cassandra  merupakan salah satu implementasi dari NoSQL (Not only SQL) disamping CouchDB, MongoDB dan OrientDB, yang awalnya dikembangkan oleh Facebook dan juga digunakan oleh Digg, Twitter dan Cisco dalam sistem penyimpanan terdistribusi untuk mengelola data terstruktur dengan skala yang sangat besar di banyak server komoditas tanpa kegagalan.

Fitur utama Cassandra:

  • Desentralisasi:
    Setiap node di cluster memiliki peran yang sama. Tidak ada single point of failure. Data didistribusikan lintas cluster (sehingga setiap node berisi data yang berbeda), namun tidak ada master karena setiap node dapat melayani permintaan apapun yang sama.
  • Mendukung replikasi dan replikasi di multi data center:
    Strategi replikasi dapat dikonfigurasi. Cassandra dirancang sebagai sistem terdistribusi, untuk penyebaran sejumlah besar node di beberapa pusat data. Fitur utama dari arsitektur terdistribusi Cassandra adalah secara khusus dirancang untuk penyebaran di multi-pusat data, untuk redundansi, untuk failover dan pemulihan dari bencana.
  • Skalabilitas:
    Membaca dan menulis throughput yang baik meningkat secara linear ketika mesin baru ditambahkan, tanpa downtime atau dampak gangguan pada aplikasi.
  • Fault-tolerant:
    Data secara otomatis direplikasi ke beberapa node untuk toleransi kesalahan. Replikasi di beberapa pusat data didukung. Node gagal dapat diganti tanpa downtime.
  • Penyetelan secara konsisten:
    Menulis dan membaca menawarkan tingkat penyetelan secara konsistensi, sepanjang jalan dari “menulis tidak pernah gagal” untuk “blok untuk semua replika agar dapat dibaca”, dengan tingkat kuorum di tengah.
  • Dukungan MapReduce:
    Cassandra memiliki kemampuan untuk di integrasi dengan Hadoop, berikut dukungan MapReduce. Juga mendukung Apache Pig dan Apache Hive.
  • Bahasa query:
    Memperkanalkan CQL (Cassandra Query Language) diperkenalkan, merupakan SQL-like alternatif terhadap antarmuka RPC tradisional. Bahasa driver tersedia untuk Java (JDBC), Python (DBAPI2) dan Node.js (Helenus).