Mientras investigaba el concepto de Big Data, Hadoop, Pentaho... me encontré con esta base de datos opensource: Cassandra. Dado que en los últimos tiempos sólo se habla de todos estos conceptos, creo que es bueno aprender un poquito sobre esta base de datos. En este capítulo contaré el modelo de datos de Cassandra.

El modelo de datos

Cassandra es un almacén de filas con particiones.

Y es un sistema de bases de datos distribuido open source que ha sido diseñado para almacenar grandes cantidades de datos a través de servidores genéricos.

Diseñando el modelo de datos

Una clave para diseñar el modelo de datos de cassandra es basar el diseño en las querys que vamos a ejecutar, no modelando entidades y relaciones como se hace en las bases de datos relacionales. Los elementos esenciales del modelo de datos incluyen:

Familias de columnas

Una base de datos Cassandra consiste en familias de columnas. Una familia de columnas es un conjunto de pares clave-valor. Cada familia de columnas tiene una clave y consiste de columnas y filas. Podemos pensar en una familia de columnas como una tabla y cada par clave-valor como un registro de la tabla.

Nota : a partir de CQL3 se les llama tablas no familias de columnas.

Tablas

La definición de tabla depende de la versión de CQL:

En CQL 3 una tabla es una colección de columnas ordenadas(por nombre).
En las versiones anteriores, una familia de columnas era sinónimo, en algunos aspectos a una tabla. En CQL 3 una tabla es escasa, incluyendo sólo las columnas que filas se han asignado un valor.

Keyspace

La agrupación más externa de datos, similar a un esquema en una base de datos relacional. Todas las tablas van dentro de un espacio de claves. Por lo general, un clúster sólo tiene un keyspace por aplicación.

Tradución de la web original :

http://www.datastax.com/documentation/gettingstarted/index.html?pagename=docs&version=quick_start&file=cassandra_quickstart#getting_started/../getting_started/gettingStarteddataModel_c.html

Un poco de informática...

jueves, 13 de febrero de 2014

Cassandra. El modelo de Datos

El modelo de datos

Diseñando el modelo de datos

Familias de columnas

Tablas

Keyspace

No hay comentarios:

Publicar un comentario