Ya puedes apuntarte al curso gratuito "Mining Massive Datasets" que se impartirá en Coursera

Las fechas 

Sep 12 – Oct 31, 2015

Mining Massive Datasets on Coursera

 
Sobre el curso

«Introduciremos a los participantes en los sistemas de archivos distribuidos modernos y MapReduce, incluyendo que distingue a los buenos algoritmos MapReduce de buenos algoritmos en general. El resto del curso se dedica a los algoritmos de extracción de modelos e información de grandes conjuntos de datos. Los participantes aprenderán del algoritmo Google PageRank como da importancia de las páginas web y algunas de las muchas extensiones que se han utilizado para una variedad de propósitos. Cubriremos los hash sensibles al contexto, un poco de magia que permite buscar artículos similares en un conjunto de elementos tan grandes que no puede posiblemente comparar uno a uno. Cuando los datos se almacenan como una matriz muy grande y con muy pocos datos, la reducción de dimensionalidad es a menudo una buena manera de modelar los datos, pero los enfoques estándar no escala bien; hablaremos de enfoques eficientes. Muchos más algoritmos de alto nivel se revisarán, tal cual, se indica en el programa del curso.»

Lecturas sugeridas

Este es uno de los libros imprescindibles y gratuito de los profesores del curso:

 «Mining of Massive Datasets, by Leskovec, Rajaraman, and Ullman. Te lo puedes bajar del sitio web oficial www.mmds.org/

Puedes apuntarte en www.coursera.org/course/mmds