apache spark, big data, BigData, científico de datos, data scientist, MLlib, PySpark, spark dataframes, Spark SQL
Spark se ha incorporado recientemente a la caja de herramientas de la mayoría de los científicos de datos. Es un framework open source para la computación en paralelo utilizando clusters. Se utiliza especialmente para acelerar la computación iterativa de grandes... big data, BigData, científico de datos, data scientist, machine learning
Inicialmente, en el sector de Big data había una mezcla de perfiles entre informáticos, estadísticos, telecos, matemáticos, etc. Casi todos solían hacer tareas de arquitectura de sistemas, manejando frameworks y servidores con soltura, y también hacían labores de... big data, científico de datos, data scientist, machine learning, packages, R
El lenguaje R se sitúa ¡en el puesto 13! de los lenguajes de programación más populares en el segundo trimestre de 2014 según Redmonk. Este es el listado de los 20 lenguajes más populares: 1 Java / JavaScript 3 PHP 4 Python 5 C# 6 C++ / Ruby 8 CSS 9 C 10 Objective-C...