Grupo Atrium

Curso Experto en Big Data Analytics and Processing Foundations

Grupo Atrium
  • Imparte:
  • Modalidad:
    Online
  • Precio:
    2.597 €
  • Comienzo:
    Consultar rellenando el formulario
  • Lugar:
    Se imparte Online
  • Duración:
    300 Horas
  • Condiciones:
    Otros Datos: Curso De Iniciación Incluido; Profesores Expertos, Formación online tutorizada, Clases/Tutorías en directo, Formación basada en la práctica y en el desarrollo de ejercicios, Programa De Becas Personalizadas y Acceso a Bolsa de Empleo. Prácticas: Prácticas en empresas especializadas (opcionales). Disponemos de una red de empresas colaboradoras para que puedas cursar tus prácticas.
  • Titulación:
    Una vez que finalices nuestro curso conseguirás 6 titulaciones: Máster en Big Data Science Iniciación a GNU/Linux Desarrollo en Python avanzado Análisis de datos y visualización con Python Big Data Avanzado Iniciación al Machine Learning

Presentación

Qué es Big Data?
Es conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.

Dirigido

Aquellas personas que quieran adquirir las capacidades técnicas y analíticas necesarias para especializarse en Analítica de Negocio o Big Data.

Profesionales en áreas como Tecnología, negocio o departamentos analíticos que necesitan conocer las técnicas y métodos del “business analytics” para mejorar estrategias y tener una visión más global de la organización o innovar en grandes empresas.

Objetivos

Uso y gestión de los sistemas BI Y Big Data y de las tecnologías asociadas, adquisición de competencias básicas de la explotación de datos.

Conocer funcionamiento y adquirir competencias básicas en el uso de BBDD NOSQL orientadas a documentos (MongoDB) y orientadas a grafos Neo4J.

Adquisición de conocimientos y competencias prácticas básicas en técnicas de visualización , aprender a diseñar y construir visualizaciones interactivas.

Adquirir las bases necesarias del lenguaje Phyton, para su posterior aplicación en el desarrollo de programas, y pruebas unitarias, combinadas con la utilización de patrones y buenas prácticas de programación.

Conocer las formas de procesamiento/almacenamiento de datos a gran escala. Ecosistema Hadoop.

Conocer la arquitectura Spak y su impacto en el mundo Big Data. Módulos de Spark. Procesamiento a gran escala con Spark. Programación con Scala y PySpark.

Programa

1) Módulo 1: Introducción a los sistemas Informáticos y tecnologías Big Data (5 sesiones)
Principales componentes de un sistema informático. Sistemas Operativos, para que sirven, que tipos hay y cómo funcionan…
Introducción a GNU/Linux
GNU/Linux Avanzado
Como usar GNU/Linux en Cloud (AWS)
– Introducción teórica a las tecnologías Big Data: Bases de Datos SQL/No SQL, Computación distribuida, Cloud…
2) Módulo 2: Fundamentos de Programación en Python (6 sesiones)
Introducción a los lenguajes de programación
Python: Sentencias Básicas y Bloques Lógicos
Python: Funciones y Scope
Python: Clases y Objetos y Tratamiento de Excepciones
Python: Módulos y Uso de librerías de Python
3) Módulo 3: Programación Orientada a Datos (3 sesiones)
Python: Librerías básicas de Data Science: Pandas, Numpy, Matplotlib, Sklearn…
Introducción teórica al análisis exploratorio de Datos
Python: Ejemplificación del análisis exploratorio de datos mediate Datasets reales
4) Módulo 4: Introducción al Machine Learning (2 sesiones)
Desambiguación de términos: ¿Machine Learning? ¿Deep Learning? ¿Data Science? ¿Big Data? Machine Learning: Aprendizaje supervisado (regresión/clasificación), no supervisado y por refuerzo.
Nuestros primeros pasos con el Machine Learning: Regresión Lineal y Regresión Logística. Ejemplos con datos reales en Python.
5) Módulo 5: Bases de Datos e Ingestión de datos (3 sesiones)
Bases de datos SQL
Bases de datos NoSQL: Clave-Valor, Columnares, Documentales y de Grafos
Bases de Datos NoSQL Documentales: MongoDB (PyMongo)
Sistemas de ingestión de datos en tiempo real: Kafka
6) Módulo 6: Procesamiento Distribuido (5 sesiones)
Funcionamiento de un sistema Big Data de Procesamiento Distribuido: Ingestión, Almacenamiento, Gestión de Recursos, Cálculo Distribuido…
Hadoop: Instalación y configuración, HDFS y YARN
Introducción a Spark: Instalación y configuración, pySpark y DataFrame API
Machine Learning con Spark: MLlib
Microservicios: Kubernetes y Docker
Arquitecturas Big Data: Lamba vs Kappa vs Microservicios
7) Módulo 7: TFM (Opcional) (2 meses)
El alumno presentará una propuesta de proyecto de en el que se utilicen tecnologías Big Data y lenguaje de Python para resolver un caso de negocio al docente.
Una vez aprobada la propuesta el alumno lo realizará
Al entregarlo el docente dará su feedback y si este es positivo el alumno tendrá una mención especial en su diploma y prioridad en nuestra bolsa de empleo

Salidas profesionales

Arquitecto de soluciones Big Data
Administrador y/o desarrollador de sistemas Big Data
Chief Data Officer (CDO).
Machine Learning Engineer.
Business Analyst.
Big Data Consultant.
Analista de datos (Data Analyst)
Big Data Developer.
Big Data Engineer.
Data Scientist.
Data Analyst.
NLP Consultant.

¡Infórmate ahora sin compromiso!

Publicidad

Cursos Relacionados

Ver otros masters de...