Mientras investigaba el concepto de Big Data, Hadoop, Pentaho... me encontré con esta base de datos opensource: Cassandra. Dado que en los últimos tiempos sólo se habla de todos estos conceptos, creo que es bueno aprender un poquito sobre esta base de datos. En este capítulo contaré el modelo de datos de Cassandra.
Tradución de la web original :
El modelo de datos
Cassandra es un almacén de filas
con particiones.
Y es un sistema de bases de datos
distribuido open source que ha sido diseñado para almacenar grandes cantidades
de datos a través de servidores genéricos.
Diseñando el modelo de datos
Una clave para diseñar el modelo
de datos de cassandra es basar el diseño en las querys que vamos a ejecutar,
no modelando entidades y relaciones como se hace en las bases de datos
relacionales. Los elementos esenciales del modelo de datos incluyen:
Familias de columnas
Una base de datos Cassandra
consiste en familias de columnas. Una familia de columnas es un conjunto de
pares clave-valor. Cada familia de columnas tiene una clave y consiste de
columnas y filas. Podemos pensar en una familia de columnas como una tabla y
cada par clave-valor como un registro de la tabla.
Nota : a partir de CQL3 se les
llama tablas no familias de columnas.
Tablas
La definición de tabla depende de
la versión de CQL:
- En CQL 3 una tabla es una colección de columnas ordenadas(por nombre).
- En las versiones anteriores, una familia de columnas era sinónimo, en algunos aspectos a una tabla. En CQL 3 una tabla es escasa, incluyendo sólo las columnas que filas se han asignado un valor.
Keyspace
La agrupación más externa de
datos, similar a un esquema en una base de datos relacional. Todas las tablas
van dentro de un espacio de claves. Por lo general, un clúster sólo tiene un
keyspace por aplicación.
http://www.datastax.com/documentation/gettingstarted/index.html?pagename=docs&version=quick_start&file=cassandra_quickstart#getting_started/../getting_started/gettingStarteddataModel_c.html
No hay comentarios:
Publicar un comentario