Curso de Especialista en Big Data con Apache Hadoop - UTN - Universidad Tecnológica Nacional


Curso de Especialista en Big Data con Apache Hadoop

La carrera Curso de Especialista en Big Data con Apache Hadoop es uno de los Cursos Cortos de Informática e Información que dicta la Universidad Tecnológica Nacional

Duración 5 SEMANAS

El título de Curso de Especialista en Big Data con Apache Hadoop es el título que otorga la Universidad Tecnológica Nacional para la carrera de Curso en Informática

Descripción
Dentro de las herramientas para trabajar con Big Data Apache Software Foundation creó Hadoop.Haddop es un marco de trabajo de software basado en Java y que soporta aplicaciones distribuidas bajo una licencia de software libre – freeware. Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos.

La formación de Especialista en Big Data tiene como objetivo familiarizar a los participantes con el uso de las técnicas y herramientas más difundidas de Hadoop.Se espera que los participantes incorporen criterios para saber cuándo emplear y cuando no emplear las técnicas y herramientas de Big Data.

El objetivo es f
ormar a los asistentes en Big Data, para lo que se requiere que los participantes:

  • Entiendan las ventajas y desventajas de las técnicas de Big Data
  • Sepan distinguir los problemas que son susceptibles de emplear las técnicas de Big Data
  • Comprendan los contextos en los cuales Big Data no tiene sentido desde el punto de vista de almacenamiento y explotación de la información
  • Conozcan las herramientas disponibles identificando sus fortalezas y debilidades
  • Sepan utilizar las funciones más difundidas de Apache Hadoop
  • Puedan diseñar un flujo de trabajo con MapReduce, el modelo de programación utilizado por Google para dar soporte a la computación paralela

Destinado a profesionales que quieran aplicar herramientas y técnicas de Big Data a problemas de negocios ya sea en forma general o dentro de las herramientas propuestas por Apache Hadoop.

Plan de Estudios

La modalidad del curso es a Distancia, totalmente mediada por tecnologías a través del Campus Virtual FRBA. Tiene una duración de 5 semanas y una carga horaria de 38 horas.

Contenidos

Unidad 1: ¿Qué es Apache Hadoop?

  • Big Data y la necesidad de Apache Hadoop
  • La explosión de los volúmenes de datos
  • La variación de las estructuras de datos
  • El Origen y Diseño de Apache Hadoop
  • El procesamiento distribuido con MapReduce
  • El ecosistema de Apache Hadoop
 

Unidad 2: ¿Cuando usar Apache Hadoop?            

  • Big data vs small data: ¿Cuando usar cada aproximación? 
  • Casos de uso comunes para Big Data en Apache Hadoop (log clickstram, Detección de Fraude, Análisis de sentimientos, Clasificación de imágenes, etc)
 

Unidad 3: ¿Como configuramos un entorno Apache Hadoop?

  • La elección de una distribución de Apache Hadoop
  • La elección de una arquitectura de cluster Apache Hadoop (Modo Pseudo-distribuida vs Modalidad completamente distribuida (un clúster de nodos))
  • Instructivo para la configuración
 

Unidad 4: HDFS y MAP REDUCE

  • Almacenamiento de datos en un File System Tradicional vs Almacenamiento de datos en HDFS
  • Arquitectura HDFS
  • Gestión de archivos con los comandos del HDFS
  • Pensando en paralelo
  • Fase Map
  • Fase Reduce
  • Ejemplo ilustrativo
  • Escribiendo un Map Reduce
 Unidad 5: Otros Lenguajes para Hadoop y Pasos Siguientes
  • Hive
  • Pig
  • Relación entre ambos lenguajes
  • Escribiendo un Map Reduce en Hive
  • Escribiendo un Map Reduce en Pig
  • Ejemplos comparativos entre MAP REDUCE, PIG y HIVE
  • Otros Lenguajes




Facultades donde estudiar Curso de Especialista en Big Data con Apache Hadoop en la Universidad Tecnológica Nacional


Solicita Información al Instante



Al solicitar informes autorizo a cursosadistancia.com.ar, a sus dependientes, subcontratados o asociados a contactarme para asesorarme en relación a propuestas educativas relacionadas con cualquiera de las alternativas existentes en el territorio argentino.

Cursos Similares


Cursos Recién Vistas