Resumen de la experiencia ejecutando el tutorial Running the Quickstart for dbt and Snowflake Tutorial con dbt Projects on Snowflake
Este artículo resume mi recorrido siguiendo el tutorial oficial Quickstart for dbt and Snowflake adaptado para dbt Projects on Snowflake. El objetivo es aprender dbt desde cero y ver cómo funciona su integración directa dentro de Snowflake sin usar dbt Cloud.
Notas importantes sobre el alcance
Se omiten funcionalidades exclusivas de dbt Cloud como Managed Repository, visualización de documentación integrada y configuración de entornos y jobs propias de dbt Cloud. En dbt Projects on Snowflake el control de entornos se gestiona mediante profiles.yml y el despliegue se realiza como proyecto dbt dentro de un esquema deployable que puede ejecutarse como task.
Requisitos previos
Necesitarás una cuenta de prueba en Snowflake. Activa secondary roles si es necesario verificando la propiedad default_secondary_roles para tu usuario y ajustándola en caso contrario.
Paso 1 Introducción
El flujo del tutorial cubre crear un worksheet en Snowflake, cargar datos de ejemplo, convertir consultas en modelos dbt, declarar sources, añadir tests, documentar modelos y finalmente desplegar el proyecto para ejecución programada mediante tasks en Snowflake.
Paso 2 Crear un worksheet
Desde Projects en Snowflake se crea un Worksheet nuevo para ejecutar consultas y operaciones administrativas. Este será el espacio desde el que se crean bases de datos, esquemas, tablas y se definen tasks.
Paso 3 Cargar datos
El tutorial incluye la creación de una base raw con esquemas jaffle_shop y stripe y la carga de CSV públicos en tablas de ejemplo. En esta fase se generan las tablas customers orders y payment que se usarán como datos fuente.
Paso 4 Conectar dbt a Snowflake
En dbt Cloud esto requiere configuración específica, pero en dbt Projects on Snowflake no es necesario establecer una conexión externa ya que el desarrollo se ejecuta dentro del entorno de Snowflake.
Paso 5 Managed Repository
Se omite. En este tutorial se desarrolla sin integración Git. Si se desea Git se puede integrar con dbt Projects on Snowflake usando los flujos apropiados y repositorios externos.
Paso 6 Inicializar proyecto dbt y empezar a desarrollar
Desde Projects Workspaces se crea un dbt Project nuevo indicando nombre, role, warehouse, database y schema de desarrollo. Esta información queda reflejada en profiles.yml y permite ejecutar comandos dbt como dbt run desde el Workspace para materializar los modelos en el esquema de desarrollo.
Paso 7 Construir el primer modelo
Se crea un archivo SQL customers.sql en la carpeta models que combina customers y orders para producir una vista o tabla de clientes con métricas básicas. Ejecutar dbt run materializa el modelo según la configuración activa.
Paso 8 Cambiar la materialización
La materialización define si un modelo se crea como view table incremental o ephemeral. Se puede ajustar globalmente en dbt_project.yml o por archivo mediante config. Cambiar de view a table ejemplifica cómo dbt recrea objetos en Snowflake según la política de materialización.
Paso 9 Eliminar modelos de ejemplo
Eliminar archivos SQL del proyecto no borra automáticamente las tablas o vistas existentes en Snowflake. Hay que limpiar los objetos manualmente si se desea liberar espacio o evitar confusión.
Paso 10 Modelos sobre modelos
Siguiendo buenas prácticas se crean modelos de staging stg_customers y stg_orders que normalizan y renombran columnas. El archivo customers final referencia esos staging models usando la función ref para declarar dependencias. Compilar el proyecto permite visualizar el DAG de dependencias en el Workspace.
Paso 11 Modelos sobre sources
Se declaran sources en un archivo YAML para indicar la base raw y esquemas origen. Luego los staging models utilizan la función source para referenciar las tablas originaLes. Al compilar, la linEa de origen aparece en el DAG y las referencias se resuelven al nombre físico de tabla.
Paso 12 Añadir tests
Dbt permite definir tests de datos en archivos YAML. En el ejemplo se definen tests unique not_null accepted_values y relationships para garantizar integridad de claves y valores válidos. Ejecutar dbt test ejecuta esas comprobaciones y muestra PASS o FAIL en los logs del Workspace.
Paso 13 Documentar modelos
La generación de documentación con dbt docs generate no estaba disponible en la versión de dbt Projects on Snowflake usada en mi prueba, por lo que esa parte se omitió. En entornos con soporte, dbt docs permite navegar modelos tests y lineage con descripción y ejemplos.
Paso 14 Commit de cambios
En este tutorial desarrollamos sin Git. Para integrar control de versiones hay que configurar un repositorio externo y enlazarlo al dbt Project siguiendo la guía de Git integration para dbt Projects on Snowflake.
Paso 15 Desplegar dbt
Para producción se añade un target prod en profiles.yml con el schema de salida PROD. El proyecto dbt se despliega como un dbt Project en un esquema deployable y desde ahí se crea una task de Snowflake que ejecuta dbt build con target prod. La task puede programarse y ejecutarse manualmente para materializar tablas y ejecutar tests en producción.
Conclusión
Ejecutar el Quickstart for dbt and Snowflake dentro de dbt Projects on Snowflake es una excelente forma de aprender dbt y al mismo tiempo aprovechar la ejecución nativa en Snowflake. El flujo cubre desde la carga de datos hasta el despliegue automatizado como task, con control de materializaciones tests y lineage.
Sobre Q2BSTUDIO
En Q2BSTUDIO somos una empresa de desarrollo de software especializada en aplicaciones a medida y soluciones de software a medida para empresas de todos los tamaños. Nuestro equipo combina experiencia en inteligencia artificial y desarrollo backend y frontend para entregar productos escalables y seguros. Ofrecemos servicios de ciberseguridad para proteger aplicaciones y datos, servicios cloud aws y azure para desplegar infraestructuras resilientes y servicios inteligencia de negocio que incluyen integración con Power BI para crear dashboards accionables.
Nuestras capacidades en inteligencia artificial abarcan soluciones de ia para empresas, diseño e implementación de agentes IA y modelos personalizados que automatizan procesos y extraen valor de los datos. Integramos pipelines de datos con herramientas como dbt y plataformas cloud para ofrecer procesos reproducibles y auditables. Si buscas partner para crear aplicaciones a medida o transformar tus datos en inteligencia de negocio, Q2BSTUDIO aporta experiencia técnica y enfoque orientado a resultados.
Palabras clave y posicionamiento
Aplicaciones a medida software a medida inteligencia artificial ciberseguridad servicios cloud aws y azure servicios inteligencia de negocio ia para empresas agentes IA power bi aplicaciones a medida software a medida inteligencia artificial
Invitación final
Si quieres probar el flujo Quickstart y necesitas asesoría para integrarlo en tus pipelines de datos o desplegar soluciones con seguridad y escalabilidad, ponte en contacto con Q2BSTUDIO y te ayudamos a diseñar la arquitectura, implementar modelos y llevar tus datos a producción.