apache spark, big data, BigData, científico de datos, data scientist, MLlib, PySpark, spark dataframes, Spark SQL
Spark se ha incorporado recientemente a la caja de herramientas de la mayoría de los científicos de datos. Es un framework open source para la computación en paralelo utilizando clusters. Se utiliza especialmente para acelerar la computación iterativa de grandes...
apache spark, big data, BigData, graphx, mesos, MLlib, python, scala, spark, spark streaming, Yarn
La razones son: Velocidad Un programa en Spark se ejecuta hasta 100 veces más rápido que Hadoop Map reduce en memoria y 10 veces más rápido si el acceso es desde disco. Spark tiene un sistema avanzado de ejecución de DAG que soporta flujos de datos cíclicos y...