apache spark, big data, machine learning, scala
Casi siempre que hacemos una presentación de como abordamos los proyectos de big data nos preguntan: ¿por que nos recomendais usar Apache Spark? Y algunas de nuestras repuestas son: Spark nos da mucha más potencia que hadoop Para empezar Spark es un framework de...
apache spark, big data, Data Engineering, ingenieria datos, Kafka
La empresa Insight Data Engineering ha creado un mapa interactivo que permite navegar por las tecnologías y herramientas que más se usan en el ecosistema de ingenoería de datos. Es un buen resumen para revisar de vez en cuando e incluir en las presentaciones. De las...
apache spark, big data, BigData, hadoop, java, python, scala
El documento original de la encuesta publicada por typesafe se puede solicitar en este enlace. El resumen visual de la encuesta a más de 2100 profesionales de IT es este: ¿Todavía no usas Apache Spark? Nosotros tenemos algunos argumentos para usar Apache Spark en...
apache spark, big data, BigData, graphx, mesos, MLlib, python, scala, spark, spark streaming, Yarn
La razones son: Velocidad Un programa en Spark se ejecuta hasta 100 veces más rápido que Hadoop Map reduce en memoria y 10 veces más rápido si el acceso es desde disco. Spark tiene un sistema avanzado de ejecución de DAG que soporta flujos de datos cíclicos y...
apache spark, BigData, MachineLearning, PacoNathan
Spark Training Course Así se llamó esta jornada que se celebró hace unas semanas en la Universidad A Coruña con Paco Nathan como experto en Big Data, y Juantomás García como profesor en una jornada más práctica al día siguiente. Juantomás García: Spark Training Day ...