Observability Engineer
Descripción del puesto
Diseñar, desarrollar, implementar y optimizar soluciones de monitoreo para infraestructuras cloud.Definir, analizar e implementar dashboards para visualizar indicadores de desempeño críticos.Asegurar el correcto funcionamiento de clouds productivos basados en tecnologías open source (como Kubernetes y OpenStack).Atender las incidencias críticas de la plataforma, escalando a los Ingenieros Senior o al área de desarrollo de productos. Únete a nuestro equipo de Site Reliability Engineering como Observability Engineer, donde desarrollamos, implementamos y optimizamos herramientas que permiten un monitoreo automatizado y eficiente, proporcionando la información necesaria para corregir errores y asegurar en todo momento el correcto funcionamiento de nuestros productos en la nube en ambientes productivos.Tendrás el desafío de garantizar la estabilidad, disponibilidad y desempeño de infraestructuras cloud productivas mediante el diseño e implementación de soluciones de monitoreo y visualización de indicadores de desempeño de las plataformas para garantizar la continuidad de la operación de grandes centros de datos, que soportan las aplicaciones e infraestructura críticas e ininterrumpidas que desplegamos.Este rol está disponible para trabajo remoto desde las siguientes ubicaciones: México, Chile, Argentina, Colombia, Uruguay y Perú. Somos una empresa dedicada al desarrollo de soluciones en la nube y al despliegue de tecnología de infraestructura digital hiperescalable, basada en código abierto y con los más altos estándares de la industria.Nuestro objetivo es liderar la industria en la creación de infraestructuras digitales innovadoras y altamente eficientes a nivel mundial.Brindar servicios de telecomunicaciones ágiles, eficientes y universalmente accesibles, superando barreras geográficas y desigualdades sociales.Empoderar a los migrantes digitales para que adopten una mentalidad transformadora, inspirándolos a innovar sus procesos en beneficio de sus usuarios. En Whitestack somos líderes en Latinoamérica en el desarrollo de soluciones Telco Cloud, Open Networking e infraestructura digital híper-escalable. Trabajamos con tecnologías de código abierto como OpenStack, Kubernetes, Open Source Mano, Ceph, Prometheus, ONOS y muchas otras y colaboramos activamente con organizaciones globales como ETSI, la Open Infrastructure Foundation, el Telecom Infra Project y el Open Compute Project. Impulsamos la transformación digital en la región mediante estándares de clase mundial, grandes implementaciones para operadores y un fuerte compromiso con la innovación.Además, somos un Great Place to Work, donde la colaboración y el desarrollo personal son parte esencial de nuestra cultura.Conoce más sobre nuestras prestaciones aquí. Estudios de Ingeniería Informática, Ingeniería de Sistemas, Computación o título afín. Al menos 3 años en cargos relacionados con la gestión, optimización y monitoreo de infraestructuras en la nube, especialmente con tecnologías como Kubernetes y/o OpenStack, y el manejo de incidencias y entornos productivos.Experiencia en diseño, desarrollo, implementación y optimización de soluciones de monitoreo para infraestructuras cloud.Monitoreo AvanzadoUso y configuración de herramientas de monitoreo (Prometheus, Grafana, Elasticsearch, Kibana).Python Avanzado2-3 años de experiencia en el desarrollo de software con PythonConocimiento de estructuras de datos, POO, complejidad computacional, patrones de diseño, concurrencia. Linux IntermedioComandos básicos, manipulación de archivos, red, etc.Experiencia con Shell scripting (Bash).Automatización (scripting) con Bash y/o Python. Admin Kubernetes IntermedioUso y administración de clusters de Kubernetes.