Blog

Qué es Google BigQuery

08/08/2014

Como dijimos en otro post anterior, en la división de Big Data de ASPgems hemos trabajado con Hadoop. También trabajamos con otros frameworks como Spark, y con servicios web de Cloud Computing como Google BigQuery. Esta última herramienta web resulta especialmente atractiva por su facilidad de uso, su funcionalidad y su precio.

 

 

El servicio web de Google BigQuery permite realizar almacenamiento y consulta de conjuntos de datos masivos con billones de filas. Su uso es sencillo y permite a los desarrolladores y analistas de negocio estudiar bases de datos (casi) en tiempo real. Realiza consultas del tipo SQL sobre conjuntos de datos que contienen terabytes de información en unos pocos segundos. Aquí se encuentra la sintaxis de las principales consultas que se pueden realizar en BigQuery. Conociendo previamente el lenguaje SQL, la programación de consultas es realmente sencillo. Los resultados se pueden almacenar en tablas y también exportar para su análisis externo. Los principales comandos para la administración de tablas se pueden encontrar en este documento de Google developers (previo registro). Se puede utilizar como si fuera un DataWarehouse, con el único inconveniente de no poder modificar ni añadir registros de forma individual.

 

 

Existen bastantes, o al menos suficientes, herramientas de terceros que interactúan con BigQuery para realizar carga, consultas y visualización de datos. Una de las que ya hemos utilizado es el software R mediante la librería bigRquery. Con esta librería se pueden cargar y modificar tablas, conjuntos de datos y consultas todo ello directamente desde R. Aquí se puede ver un ejemplo.

 

Además también se pueden utilizar herramientas propias de Google como Prediction API. Esta interesante API utiliza modelos de machine learning que pueden realizar predicciones en tiempo real. Tiene implementados diferentes métodos que pueden ser útiles para análisis de sentimientos, análisis de riesgos, clasificación de clientes, filtrado de correo, etc.

 

Los precios son bastante asequibles. El almacenamiento de datos cuesta 0.26$/Gb al mes y las consultas 5$/Tb, con los primeros 100Gb procesados cada mes gratis.

Podéis dejar vuestros comentarios si ya lo habéis probado o vuestras consultas.

 

 

 

También te puede gustar…

Caso de éxito: Fronda

Caso de éxito: Fronda

Fronda, es una cadena de centros de jardinería que cuenta con una tienda online que opera por toda España con la que hemos colaborado.

ASPgems icon
C/ Sextante, 9
28023 Madrid,
España

Hablemos.

A %d blogueros les gusta esto: