Arquitectura de Referencia: Solución Cloud Data

Ecosistema de Datos basado en Google Cloud Platform (GCP)

Diseño conceptual adaptable a entornos AWS, Azure, Snowflake, Clickhouse y herramientas como Airflow o dbt

Fuentes de Datos (Input)

Sistemas Core
ERP / CRM / SQL Databases
Activos Digitales
Excel / CSV / TXT / JSON
Cloud Storage
Buckets / Data Lake (RAW)
Capa de Orquestación y Procesamiento
Cloud Workflows
Control de Flujo
Cloud Functions
Python / ETL Lógica

Core Analytical System: BigQuery Warehouse

Jerarquía de Datos Estructurados

1
Ambiente Cloud data-analytics-prod
2
Dataset [ raw | dwh | agg ]
3
Modelado [ fact_tables | dim_tables ]
DATAFORM
Motor de transformaciones SQL nativas para lógica de negocio

Explotación y Visualización

Power BI
Dashboards Analíticos
Conectores / API
Extractos / Google Drive
Notificaciones
SUCCESS LOG / EMAIL

Glosario y Leyenda de Arquitectura

ETL

Extract, Transform, Load: Proceso de extracción, transformación y carga de datos.

RAW Dataset

Base de datos para el almacenamiento de tablas en su estado original (en bruto).

DWH Dataset

Capa de datos modelada donde residen las Fact Tables (hechos) y Dimension Tables (maestros).

AGG Dataset

Tablas agregadas y calculadas que sirven como entrada directa para dashboards e informes.

GCP

Google Cloud Platform: Suite de servicios en la nube de Google.

DATAFORM

Herramienta de desarrollo de datos basada en SQL para gestionar flujos en BigQuery.