Formación técnica o universitaria en Informática, Computación, Telecomunicaciones o carrera afín.Al menos 3 años de experiencia en soporte de aplicaciones, operaciones TI, producción, NOC o atención de incidentes N1/N2.Experiencia diagnosticando y resolviendo incidentes en ambientes productivos.SQL intermedio: consultas, filtros, joins, agregaciones y análisis de datos.Experiencia con herramientas de monitoreo y logs como Grafana, Application Insights, Azure Monitor o similares.Conocimientos de contenedores y Kubernetes para revisar pods, eventos, reinicios y logs.Comprensión de aplicaciones web, APIs REST, microservicios e integraciones.Conocimiento de severidad, impacto, SLA, escalamiento, recuperación y cierre de incidentes.Capacidad de investigar con autonomía, formular hipótesis, documentar y comunicarse con claridad.Perfil curioso, metódico, responsable y orientado a resolver problemas. Monitorear la disponibilidad y rendimiento de aplicaciones, microservicios, bases de datos, integraciones e infraestructura.Revisar dashboards, alertas, métricas, logs y trazas en Grafana, Application Insights u otras herramientas.Atender incidentes N1/N2, priorizarlos según impacto y SLA, diagnosticar y resolver dentro de su ámbito.Analizar SQL, APIs, colas, procesos batch/CRON y componentes Kubernetes para identificar fallas.Ejecutar acciones de recuperación autorizadas y escalar casos complejos con evidencia, impacto e hipótesis técnica.Mantener el seguimiento hasta la recuperación y validación del servicio.Documentar hallazgos, acciones y soluciones; mantener runbooks y criterios de escalamiento.Participar en análisis de causa raíz y proponer alertas, automatizaciones y mejoras preventivas. Buscamos un/a Ingeniero/a de Operaciones y Soporte para integrarse al equipo responsable de la continuidad operacional de plataformas financieras críticas. El rol combina monitoreo proactivo, diagnóstico técnico y resolución de incidentes sobre aplicaciones, microservicios, bases de datos, integraciones y servicios desplegados principalmente en Azure y Kubernetes.La persona deberá analizar métricas, logs y trazas, correlacionar información de distintas fuentes, ejecutar acciones de recuperación dentro de su ámbito y escalar con evidencia técnica cuando sea necesario. No buscamos un perfil limitado a revisar alertas o derivar tickets, sino a alguien curioso, metódico y resolutivo, capaz de acompañar los incidentes hasta su recuperación y validación.Trabajará junto a Desarrollo, Datos, Infraestructura, Ciberseguridad y proveedores, participando además en la creación de runbooks, análisis de causa raíz, automatización y mejoras de observabilidad, estabilidad y disponibilidad. Te integrarás a un equipo responsable de plataformas financieras críticas, participando directamente en su operación, estabilización y mejora continua. Tendrás exposición a aplicaciones, microservicios, datos, integraciones, nube y Kubernetes, con espacio para proponer mejoras y automatizar tareas.Nuestros beneficios incluyen:Seguro complementario de salud, dental y vida.Pago de los primeros tres días de licencia médica.Complemento del subsidio asociado a licencias médicas.Días adicionales de vacaciones según temporada.Aguinaldos de Fiestas Patrias y Navidad.Tarde libre durante el día de tu cumpleaños.Jornada laboral de 40 horas semanales. Experiencia en servicios financieros, plataformas transaccionales o ambientes de alta disponibilidad.Conocimiento de Azure, especialmente AKS, Application Insights, Azure Monitor, Storage, Functions y Service Bus.Experiencia con SQL Server y revisión de colas, reintentos o dead-letter queues.Manejo de PowerShell, Python, Bash u otro lenguaje de scripting.Conocimiento de Grafana, Prometheus, Loki, Kibana, k9s o Lens.Nociones de redes, DNS, certificados, HTTP, autenticación y conectividad entre servicios.Experiencia con ITIL, análisis de causa raíz, gestión de problemas, continuidad operacional o pipelines CI/CD.

Ingeniero/a de Operaciones y Soporte de Plataforma

Descripción del puesto