Tus datos en la nube: ETLs con Python en el cloud

Lleva tus habilidades de tratamiento de datos con Python al siguiente nivel generando tus propios proyectos sin límites.

Ratings 3.15 / 5.00
Tus datos en la nube: ETLs con Python en el cloud

What You Will Learn!

  • Implementación de ETLs en Python con un framework híbrido (cloud-local) para su automatización.
  • Un método que te servirá al abordar proyectos de obtención, transformación y carga de datos de forma profesional.
  • Obtención de datos con Python desde múltiples tecnologías como APIs REST, ficheros JSON o bases de datos SQL.
  • Tratamiento y obtención de datos desde texto mediante expresiones regulares (RegEx).
  • Desarrollo de procesos de obtención de datos desde páginas web mediante webscraping en Python.
  • Metodología y código para asegurarnos que nuestros datos tienen la forma, estructura y calidad que deseamos para nuestros análisis.
  • Creación y despliegue de recursos cloud en un proveedor hiperescalar para alojar tus propios datos en la nube.
  • Desarrollo de una base de datos destinada para el análisis de datos estructurados.
  • Inyección y extracción de datos desde bases de datos SQL mediante Python.

Description

  • ¿Quieres aprender a desplegar sistemas de gestión de datos en la nube mediante ETLs?

  • ¿Tienes conocimientos en el campo del análisis de datos o el Machine Learning y quieres conocer cómo desplegar sistemas de consumo de datos en producción?

  • ¿No te sientes suficientemente confiado en tus habilidades de programación para crear tus propios sets de datos?

Si la respuesta a alguna de estas preguntas es Sí, entonces este curso es para ti.

La proliferación exponencial de nuevos tipos de fuentes de datos y el ritmo de generación de los mismos son probablemente los factores clave detrás del auge de toda la innovación que conlleva el Big Data y el análisis de datos en general.

Por eso como profesionales en este sector, no sólo es importante tener la capacidad de generar y entrenar modelos, sino aprender a desarrollar sistemas que puedan generar para nosotros nuestros propios sets de datos.

Sin embargo, aun teniendo acceso a cantidades brutales de datos, estos no siempre son ni fácilmente accesibles ni suelen estar en los formatos ni estándares de calidad que deseamos. Nuestra misión será dotarte de conocimientos y herramientas para poder afrontar estos escenarios con éxito.

En este curso vas a aprender a hacerlo cubriendo todo el ciclo de vida del dato y no sólo con un enfoque práctico, sino también usando fuentes y datos reales.

Conocerás y practicarás para dominar un montón de herramientas y tecnologías relacionadas con el mundo del manejo de datos, sobretodo en relación a la obtención, la transformación o manipulación y la carga de los mismos.

El curso se desarrolla sobre el concepto de ETL, los procesos que permiten precisamente obtener, procesar y cargar los datos desde un sistema a otro para conocer y dominar todas las tecnologías implicadas. Además aprenderemos a automatizar estos sistemas con un framework híbrido (cloud-local) basado en Python, uno de los lenguajes de programación por excelencia en el mundo del análisis de datos.

Lo más interesante de todo no solo es eso sino que:

  • las herramientas que conocerás son altamente compatibles entre sí, con lo que crearás una caja de herramientas que te será muy útil cuando enfrentes este tipo de escenarios.

  • Más allá de las herramientas, te daremos un método que te servirá al abordar proyectos de forma profesional.

En el desarrollo del curso, cubriremos temas como:

  • El contexto en el que viven este tipo de proyectos, los sistemas de gestión empresariales. Cubriremos aspectos como qué tipos existen, en qué tipo de tecnologías de gestión de datos suelen basarse y como benefician a los negocios.

  • Introduciremos el ecosistema IT donde se alojará nuestro proyecto: el cloud (la nube). Conoceremos qué tipos de servicios existen, el estado del mercado y las tecnologías que destacan en el mundo del tratamiento de datos en este modelo de consumo de recursos IT.

  • Conoceremos con profundidad los sistemas ETL, que se encargan de gobernar la extracción/obtención de datos desde un sistema, el tratamiento basado en manipulaciones y conversiones que se les da a estos datos para que cumplan nuestros objetivos y la carga en sistemas preparados para el análisis de datos a escala.

  • Implementaremos estas ETLs en Python con un framework híbrido (cloud-local) llamado Prefect. Este framework nos permitirá automatizar y orquestar nuestras tareas de ETL combinándolas con la flexibilidad y potencia que nos proporciona el tratamiento de datos con Python y sus librerías, el lenguaje más usado en el mundo del análisis de datos.

  • Conoceremos y obtendremos datos desde APIs REST basadas en webservices, ficheros JSON o bases de datos SQL.

  • Profundizaremos en uno de los campos más interesantes en esta industria, el webscraping, con el que podremos extraer datos que estén en páginas web de forma automatizada de forma que ¡todos los datos que estén en internet se convertirán en potenciales fuentes de datos para ti! Y créenos que eso es un gran poder ;-).

  • Aprenderás a tratar texto con una de las técnicas más potentes, las expresiones regulares, cazando datos y patrones de interés de forma eficiente y automatizable desde strings o cadenas para ser extraídos o tratados posteriormente.

  • Revisaremos metodologías y código para asegurarnos que nuestros datos tienen la forma, estructura y calidad que deseemos para nuestros análisis.

  • Crearás y desplegarás recursos cloud en un proveedor hiperescalar para alojar tus propios datos en la nube, así como desarrollar conexiones a ellos desde Python.

  • Instalaremos y usaremos uno de los entornos de desarrollo (IDE) más usados hoy en día, Visual Studio Code, con el que podrás trabajar de forma eficiente y profesional proyectos del mundo del análisis de datos.

Acabaremos poniendo todo esto en práctica con un caso real y de interés actual, en el que aprenderás a obtener datos sobre el valor del Bitcoin así como de los valores bursátiles de varias empresas cotizadas en la bolsa americana, a fin de crear un set de datos que permita analizar si existe dependencia entre los valores bursátiles y el valor de la criptomoneda.

Este curso es ideal para cualquiera que quiera obtener conocimientos acerca de la ingeniería y infraestructura de datos. En particular te lo recomiendo si eres:

  • Data scientist o te estás formando para ello, de forma que aprendas a usar Python para capturar y crear tus propios sets de datos para su posterior análisis.

  • Iniciados como analistas de datos que quieren mejorar su portfolio desde una perspectiva más de infraestructura y gobierno de datos.

  • Un consultor freelance en tecnología IT que quiere profundizar en el mundo del Big Data o la ingeniería de datos.

  • Product o Project Manager que tiene necesidad de conocer la realidad y superar los retos que estas nuevas tecnologías conllevan

Si buscabas aprender Python para poner tus ideas en producción, yo no esperarías más! ¡Apúntate ya haciendo click en el botón de tomar este curso ahora, y nos vemos en clase!

Who Should Attend!

  • Data scientist o personas que se estén formando en ello, de forma que aprendas a usar Python para capturar y crear tus propios sets de datos.
  • Analistas de datos o personas que estén estudiando el tema que quieren mejorar su portfolio desde una perspectiva de infraestructura y gobierno de datos.
  • Un consultor freelance en tecnología IT que quiere profundizar en el mundo del Big Data o la ingeniería de datos.
  • Un consultor freelance en tecnología IT que quiere profundizar en el mundo del Big Data o la ingeniería de datos.

TAKE THIS COURSE

Tags

  • Cloud Computing
  • ETL
  • Microsoft Azure
  • Python

Subscribers

1290

Lectures

84

TAKE THIS COURSE



Related Courses