Mutable Ideas

Notes and ideas about Java, Scala, Big Data, NoSQL, Quality and Software Deploy

Resumen Del Taller: Introducción Al Desarrollo De Aplicaciones Para Big Data

Durante el mes de Agosto, Juan Pampliega y yo recibimos la invitación para armar un taller de Big Data en el Espacio Fundación Telefonica como un complemento a la exposición “Big Bang Data”. Este post es un resumen del evento y las referencias de lectura para los que no tuvieran la oportunidad de participar.

Grupo Completo

Exposición de Gustavo Arjones

Exposición de Juan Pampliega

Lista de Discusión

Durante el taller creamos una lista de discusión que vaya más allá del programa y quedemos en contacto para aprender en conjunto. Si tenés interes en la tematica, inscribite acá

Resultados

Tomando los resultados de la encuesta hecha con los participantes, es muy placentero saber que 60% definió como Excelente la calidad del taller y 40% como Muy Bueno - correcto, no hubo calificaciones inferiores a estas :) - también quedó muy marcado el pedido de más horas de taller para que puedan tener más horas de practica, así que nos inspira a buscar este objetivo en futuros talleres.


Referencias

El material abajo es contiene las principales referencias que usamos para armar el material del curso. No debe ser considerado un listado exhaustivo.

Clase I y II: Introducción a Big Data y Hadoop

Libros y referencias (en papel)

Hadoop

  • Tom White, Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, March 2015
  • Alex Holmes, Hadoop in Practice, Second Edition, Manning Publications, September 2014
  • Mark Grover, Ted Malaska, Jonathan Seidman, Gwen Shapira, Hadoop Application Architectures, O’Reilly Media, Final version not released

Big Data / Apache Spark

  • Nathan Marz and James Warren, Big Data, Manning Publications, April 2015
  • Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark, O’Reilly Media, January 2015
  • Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark, O’Reilly Media, Inc., March 2015
  • Martin Kleppmann, Designing Data Intensive Applications, O’Reilly Media, Final version not released

Sitios y Newsletters:


Clase III: NoSQL databases y más

NoSQL

NewSQL

Search


Clase IV: Stream Processing

Conceptos Generales:

Kafka:

Frameworks de Procesamiento


Clase V: Apache Spark y Spark Streaming

Spark Summit 2014

Spark Summit 2015

Laboratorio Hands-On

La VM y los ejemplos están documentados en este post (en inglés)


Otros

Aplicaciones Referencia para Apache Spark

Comments