Data Scientist
2BRAINS · Get on Board · Chile
Descripción del puesto
Lenguaje y libreríasPython 3.10+ con manejo fluido (tipos, dataclasses, manejo de excepciones).pandas y numpy para procesamiento de datasets de gran volumen (1M–10M filas).scipy (optimize) para calibración de parámetros.scikit-learn, lightgbm/xgboost y shap.GeoespacialH3 (indexación hexagonal), geopandas y shapely.Conocimiento de distancias geodésicas y su aplicación práctica.Plataformas cloudBigQuery: nivel avanzado (CTEs, window functions, joins espaciales, optimización de costo/tiempo).Vertex AI: nivel intermedio (pipelines KFP básicos, despliegue de endpoints).Git/GitHub: nivel avanzado (branches, PRs, resolución de conflictos).Modelado y validaciónConocimientos en modelos gravitacionales (Huff/Reilly) — deseable, o capacidad de aprenderlos rápidamente.Experiencia en backtesting con validación temporal (walk-forward).OtrosFastAPI para endpoints de predicción.Nociones básicas de Docker.Power BI/Tableau y herramientas de visualización (matplotlib/plotly).Habilidades blandas que buscamosComunicación clara y proactiva.Autonomía con dirección: capacidad de ejecutar tareas con criterios de aceptación claros, sin necesidad de supervisión constante.Pragmatismo orientado a resultados, priorizando entregar valor a tiempo.Capacidad de identificar y comunicar bloqueos de forma temprana. ModeladoImplementar, calibrar y documentar el modelo gravitacional Huff (versión baseline).Entrenar modelos de Gradient Boosting (LightGBM/XGBoost) a nivel tienda como benchmark de magnitud y explicabilidad (SHAP).Elaborar reportes comparativos que documenten la elección del modelo final frente a los baselines.Plataforma, backtesting y canibalizaciónConstruir el pipeline de backtesting del modelo contra tiendas referenciales (predicción vs. real, métricas por formato y región).Implementar el cálculo de canibalización generada por la apertura de nuevas tiendas.Apoyar el desarrollo del endpoint de predicción (FastAPI) para integrarlo a la plataforma.TransversalValidar calidad de datos sobre fuentes en BigQuery (ventas, maestros de tiendas, datos demográficos, entre otros).Realizar análisis exploratorios puntuales solicitados por el equipo.Documentar técnicamente los módulos desarrollados.Participar en code reviews del equipo. En Acid Labs nos sumamos a los equipos tech de las empresas que están liderando el futuro digital en las industrias más desafiantes en Latinoamérica, con talento especializado que entiende la complejidad, respira colaboración y encuentra claridad donde otros ven ruido.Y lo hacemos #RadicalmenteMejorNo trabajamos para nuestros clientes.Trabajamos con ellos. Desde adentro. Como parte de su ritmo. Como una extensión natural de su capacidad tecnológica.Sobre el proyectoNuestro cliente está desarrollando un modelo de forecast de ventas para la apertura de nuevos proyectos inmobiliarios, basado en un modelo gravitacional tipo Huff sobre grilla geoespacial H3. Los resultados se publican en una plataforma de autogestión donde el equipo de Real Estate ingresa parámetros de un proyecto y obtiene en tiempo real estimaciones de venta, canibalización y mapas de captura, visualizados sobre un mapa interactivo. Experiencia previa con modelos de localización retail (Huff, MNL, Spatial Interaction Models).Familiaridad con datos de movilidad (tipo Azira, Cuebiq, Veraset, SafeGraph).Experiencia en proyectos de Real Estate o Site Selection en retail.Conocimientos de causal inference.Experiencia trabajando con stakeholders no técnicos.Proyecto de duración estimada de 4 meses.