Qué es Big Data?
Es conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.
Aquellas personas que quieran adquirir las capacidades técnicas y analíticas necesarias para especializarse en Analítica de Negocio o Big Data.
Profesionales en áreas como Tecnología, negocio o departamentos analíticos que necesitan conocer las técnicas y métodos del “business analytics” para mejorar estrategias y tener una visión más global de la organización o innovar en grandes empresas.
Uso y gestión de los sistemas BI Y Big Data y de las tecnologías asociadas, adquisición de competencias básicas de la explotación de datos.
Conocer funcionamiento y adquirir competencias básicas en el uso de BBDD NOSQL orientadas a documentos (MongoDB) y orientadas a grafos Neo4J.
Adquisición de conocimientos y competencias prácticas básicas en técnicas de visualización , aprender a diseñar y construir visualizaciones interactivas.
Adquirir las bases necesarias del lenguaje Phyton, para su posterior aplicación en el desarrollo de programas, y pruebas unitarias, combinadas con la utilización de patrones y buenas prácticas de programación.
Conocer las formas de procesamiento/almacenamiento de datos a gran escala. Ecosistema Hadoop.
Conocer la arquitectura Spak y su impacto en el mundo Big Data. Módulos de Spark. Procesamiento a gran escala con Spark. Programación con Scala y PySpark.
1) Módulo 1: Introducción a los sistemas Informáticos y tecnologías Big Data (5 sesiones)
Principales componentes de un sistema informático. Sistemas Operativos, para que sirven, que tipos hay y cómo funcionan…
Introducción a GNU/Linux
GNU/Linux Avanzado
Como usar GNU/Linux en Cloud (AWS)
– Introducción teórica a las tecnologías Big Data: Bases de Datos SQL/No SQL, Computación distribuida, Cloud…
2) Módulo 2: Fundamentos de Programación en Python (6 sesiones)
Introducción a los lenguajes de programación
Python: Sentencias Básicas y Bloques Lógicos
Python: Funciones y Scope
Python: Clases y Objetos y Tratamiento de Excepciones
Python: Módulos y Uso de librerías de Python
3) Módulo 3: Programación Orientada a Datos (3 sesiones)
Python: Librerías básicas de Data Science: Pandas, Numpy, Matplotlib, Sklearn…
Introducción teórica al análisis exploratorio de Datos
Python: Ejemplificación del análisis exploratorio de datos mediate Datasets reales
4) Módulo 4: Introducción al Machine Learning (2 sesiones)
Desambiguación de términos: ¿Machine Learning? ¿Deep Learning? ¿Data Science? ¿Big Data? Machine Learning: Aprendizaje supervisado (regresión/clasificación), no supervisado y por refuerzo.
Nuestros primeros pasos con el Machine Learning: Regresión Lineal y Regresión Logística. Ejemplos con datos reales en Python.
5) Módulo 5: Bases de Datos e Ingestión de datos (3 sesiones)
Bases de datos SQL
Bases de datos NoSQL: Clave-Valor, Columnares, Documentales y de Grafos
Bases de Datos NoSQL Documentales: MongoDB (PyMongo)
Sistemas de ingestión de datos en tiempo real: Kafka
6) Módulo 6: Procesamiento Distribuido (5 sesiones)
Funcionamiento de un sistema Big Data de Procesamiento Distribuido: Ingestión, Almacenamiento, Gestión de Recursos, Cálculo Distribuido…
Hadoop: Instalación y configuración, HDFS y YARN
Introducción a Spark: Instalación y configuración, pySpark y DataFrame API
Machine Learning con Spark: MLlib
Microservicios: Kubernetes y Docker
Arquitecturas Big Data: Lamba vs Kappa vs Microservicios
7) Módulo 7: TFM (Opcional) (2 meses)
El alumno presentará una propuesta de proyecto de en el que se utilicen tecnologías Big Data y lenguaje de Python para resolver un caso de negocio al docente.
Una vez aprobada la propuesta el alumno lo realizará
Al entregarlo el docente dará su feedback y si este es positivo el alumno tendrá una mención especial en su diploma y prioridad en nuestra bolsa de empleo
Arquitecto de soluciones Big Data
Administrador y/o desarrollador de sistemas Big Data
Chief Data Officer (CDO).
Machine Learning Engineer.
Business Analyst.
Big Data Consultant.
Analista de datos (Data Analyst)
Big Data Developer.
Big Data Engineer.
Data Scientist.
Data Analyst.
NLP Consultant.
¡Infórmate ahora sin compromiso!