parraletz.devPor qué Git no es suficiente para MLEl setup típico que veo: bash ml-project/ ├── .git/ ├── src/ │ └── train.py ├── data/ │ └── training.csv # 5GB, in Git └── models/ └── model.pkl # 2GB, in Git Primera pregunta: ¿Cómo está esto en Git? Respuesta común: bash # .gitignore ...Jan 14·5 min read
parraletz.devConectando los mundos - Platform Engineering meets MLTerraform, Helm, GitOps... ¿para entrenar modelos? Sí. Hoy: Cómo gestionar todo eso como código. El problema: Tienes tu stack de Platform Engineering: Terraform para infraestructura Helm para aplicaciones en K8s ArgoCD para GitOps CI/CD pipeline...Jan 13·7 min read
parraletz.devEnvironments (dev / staging / prod)"Solo necesito cambiar la variable ENV a 'prod'" - Spoiler: No Ayer: cuándo ejecutar tus pipelines. Hoy: dónde ejecutarlos. Dev, staging, producción. Lo sabes de software tradicional. Pero en ML, los ambientes son mucho más que código. Historia: Dat...Jan 12·7 min read
parraletz.devTime-based vs Event-driven: Por qué no es solo cron vs webhooksAyer: qué orquestador usar.Hoy: cuándo ejecutar ese orquestador. El setup más común que veo: ( No sean asi, xD quieran a su PE) # En el orquestador de tu elección @schedule("0 2 * * *") # Todos los días 2am def train_model(): data = fetch_data()...Jan 9·5 min read
parraletz.devConcepto de Pipeline OrquestradorAirflow, Kubeflow, Prefect, Dagster: La pregunta que todos hacen mal Ayer vimos por qué un script no es un pipeline. Hoy la pregunta obvia: "¿Qué orquestador uso?" Pero esa no es la pregunta correcta. Historia real: Hace tiempo, un colega me preguntó...Jan 8·5 min read