※注意:GCP固有ソフトウェア・技術ではない
Apache Cassandraは、高いスケーラビリティと可用性を持つ分散データベースで、大規模なデータの処理に適しています。
- 概要:
- Cassandraは、元々Facebook社において大容量のデータを格納するために開発されました。
- 2008年にソースコードが公開され、その後Apache Software Foundationのプロジェクトとなりました1。
- 主な特徴:
- 分散システム:
- CassandraはAmazon DynamoDBの技術を受けた構造で、ネットワーク分断性と可用性に強いです。
- システムとして処理能力が足りなくなるとサーバー台数を追加してスケールアウトしやすい構造になっています。
- データ保存:
- データの保存はメモリ上の空間(memtable)とディスク上の領域(SSTable)を利用します。
- 書き込み時はmemtableに、読み出し時はmemtableまたはSSTableからデータを取得します。
- クラスター内でのデータ整合性:
- CassandraはEventual Consistencyという概念で、クラスター内のデータ整合性を保ちます。
- Consistency Levelを調整することで柔軟に設定できます。
- 冗長性:
- クラスター内の全てのノードが同等の役割を持ち、単一障害点がない構造です。
- 分散システム:
Cassandraは、大規模なデータセンターで使用され、リアルタイムでのデータ処理に適しています。23 参考: Utilly参考: Wikipediaもご覧ください。









