- Complementos Optativos
- 0 (registrado)
Bienvenido al curso Big Data Engineering, en este curso vas a aprender cómo extraer información de grandes cantidades de datos utilizando tecnologías del entorno de Big Data.
Realizar esta asignatura os introducirá en cómo afrontar la explotación de gran cantidad de datos provenientes de diferentes fuentes. Este conocimiento hará que la organización donde trabajéis pueda explotar mejor tanto sus datos, como la de sus competidores, utilizando un conjunto de herramientas del ecosistema de Big Data.
Cuando termine esta asignatura, conocerás:
- Cuándo es necesario utilizar tecnologías de Big Data en vuestra organización.
- Qué tecnologías existen para consultar, analizar y visualizar conocimiento extraído de los datos.
Para ello vamos a desarrollar un conjunto de contenidos divididos en 6 bloques:
- Introducción a Big Data.
- Introducción al ecosistema Hadoop.
- Integración y Visualización de datos de fuentes heterogéneos.
- Fundamentos de Spark.
- Análisis y extracción de conocimiento con Spark.
- Aplicación a un caso real.
El estudiante ideal es una persona que quiera adentrarse en la extracción y análisis de datos en una organización. Pueden ser por ejemplo, personas que ya estén en una organización con datos potenciales y no tengan los conocimientos adecuados para explotarlos, o bien sea una persona que quiera aprender para buscar nuevas áreas de evolución profesional.
El carácter de la asignatura es muy práctico, por lo que los estudiantes tienen que estar motivados para enfrentarse a herramientas y tecnologías actuales del entorno de Big Data.
Contenidos
-
Tema 1. Introducción a Big Data
-
Lecture1.11.1. Qué es Big Data 30 min
-
Lecture1.21.2. Casos de Éxito de Aplicación 30 min
-
Lecture1.31.3. Arquitectura e Infraestructura 30 min
-
Lecture1.41.4. Introducción al caso práctico 30 min
-
-
Tema 2. Introducción al ecosistema Hadoop
-
Lecture2.12.1. Introducción a Hadoop 30 min
-
Lecture2.22.2. Distribuciones 30 min
-
Lecture2.32.3. Algunos componentes del ecosistema 30 min
-
Lecture2.42.4. Conociendo el entorno de manera práctica 30 min
-
-
Tema 3 - Integración y Visualización de datos de fuentes heterogéneos
-
Lecture3.13.1. Cómo gestionar fuentes heterogéneas 30 min
-
Lecture3.23.2. Consultas con Hive 30 min
-
Lecture3.33.3. Gestión de datos con Pig 30 min
-
Lecture3.43.4. Integración de datos con Nifi 30 min
-
Lecture3.53.5. Caso práctico (II) 30 min
-
-
Tema 4. Fundamentos de Spark
-
Lecture4.14.1. Introducción 30 min
-
Lecture4.24.2. Arquitectura 30 min
-
Lecture4.34.3. Datos en Spark 30 min
-
Lecture4.44.4. Creación y desarrollo de aplicaciones 30 min
-
Lecture4.54.5. Ejecución y despliegue 30 min
-
-
Tema 5. Análisis y extracción de conocimiento con Spark
-
Lecture5.15.1. Spark SQL: Dataframes y Datasets 30 min
-
Lecture5.25.2. Spark SQL: Operaciones SQL 30 min
-
Lecture5.35.3. Spark MLlib: Introducción y preprocesamiento 30 min
-
Lecture5.45.4. Spark MLlib: Modelos de conocimiento (Aprendizaje Supervisado) 30 min
-
Lecture5.55.5. Spark MLlib: Modelos de conocimiento (Aprendizaje No supervisado) 30 min
-
Lecture5.65.6. Spark Streaming 30 min
-
Lecture5.75.7. Caso práctico (III) 30 min
-
-
Tema 6. Aplicación a un caso real
No items in this section