apache spark, big data, BigData, científico de datos, data scientist, MLlib, PySpark, spark dataframes, Spark SQL
Spark se ha incorporado recientemente a la caja de herramientas de la mayoría de los científicos de datos. Es un framework open source para la computación en paralelo utilizando clusters. Se utiliza especialmente para acelerar la computación iterativa de grandes... big data, BigData, científico de datos, data scientist, machine learning
Inicialmente, en el sector de Big data había una mezcla de perfiles entre informáticos, estadísticos, telecos, matemáticos, etc. Casi todos solían hacer tareas de arquitectura de sistemas, manejando frameworks y servidores con soltura, y también hacían labores de... big data, data scientist, educación, kaggle, machine learning
En Kaggle tuvieron la feliz idea de convertir el análisis de datos estadísticos en un juego. Con esta idea plantearon la creación de una comunidad en la que se pudieran inscribir analistas de datos por entretenimiento y así poder resolver retos en sus momentos de... big data, científico de datos, data scientist, machine learning, packages, R
El lenguaje R se sitúa ¡en el puesto 13! de los lenguajes de programación más populares en el segundo trimestre de 2014 según Redmonk. Este es el listado de los 20 lenguajes más populares: 1 Java / JavaScript 3 PHP 4 Python 5 C# 6 C++ / Ruby 8 CSS 9 C 10 Objective-C...