apache spark, big data, BigData, científico de datos, data scientist, MLlib, PySpark, spark dataframes, Spark SQL
Spark se ha incorporado recientemente a la caja de herramientas de la mayoría de los científicos de datos. Es un framework open source para la computación en paralelo utilizando clusters. Se utiliza especialmente para acelerar la computación iterativa de grandes...