Contexto

Este proyecto cubre el diseño de un pipeline de datos completo en Google Cloud Platform, desde la ingesta hasta la visualización.

Arquitectura

API pública -> Cloud Function -> Cloud Storage (raw)
    -> Dataflow (transformación) -> BigQuery (analytics)
        -> Looker Studio (dashboard)

Orquestación: Apache Airflow (scheduling, dependencias, alertas)

Competencias demostradas

  • Ingesta de datos desde una API REST
  • Almacenamiento estructurado en Cloud Storage
  • Transformación y carga en BigQuery
  • Orquestación de tareas con Airflow
  • Capa de exposición para dashboard

Stack técnico

Python · GCP · BigQuery · Cloud Storage · Dataflow · Airflow · Looker Studio

Resultados

(Se completará cuando el proyecto esté totalmente publicado)

Ver en GitHub