Categorías
···
Entrar / Registro
Ingeniero Senior de SRE / Observabilidad
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un Ingeniero Senior de SRE/Observabilidad para garantizar la fiabilidad y el rendimiento de los sistemas productivos basados en Kubernetes que respaldan la investigación en inteligencia artificial en Azure Stack. Aspectos destacados: 1. Centrarse en la observabilidad, el soporte operativo y la consecución de la excelencia operativa. 2. Construir, mantener y mejorar soluciones de observabilidad utilizando herramientas como Grafana. 3. Colaborar con los equipos de ingeniería, plataforma e investigación para potenciar los sistemas. Buscamos un **Ingeniero Senior de SRE / Observabilidad** para garantizar la fiabilidad y el rendimiento de los sistemas productivos basados en Kubernetes que respaldan la investigación en inteligencia artificial dentro de un entorno Azure Stack. Este puesto se centra en la observabilidad, el soporte operativo y la colaboración con los equipos de ingeniería e investigación para impulsar la excelencia operativa. **Responsabilidades** * Construir, mantener y mejorar soluciones de observabilidad, incluidos paneles y visualizaciones mediante Grafana u otras herramientas similares * Definir, implementar y gestionar métricas, SLI, SLO y estrategias de alertas para los sistemas productivos * Brindar soporte operativo durante el horario comercial para entornos basados en Kubernetes, incluyendo resolución de problemas, análisis de registros e investigaciones basadas en métricas * Brindar soporte y solución de problemas a sistemas basados en SQL como parte de las operaciones productivas, ayudando en el análisis de incidencias y en las investigaciones de rendimiento * Analizar incidencias y comportamientos del sistema para identificar causas fundamentales, participar en revisiones posteriores a las incidencias y recomendar mejoras en las prácticas de monitoreo y fiabilidad * Colaborar con los equipos de ingeniería, plataforma e investigación para mejorar los estándares de observabilidad, los procesos operativos y la fiabilidad de los sistemas * Contribuir a la documentación, al intercambio de conocimientos y a la mejora continua dentro del equipo **Requisitos** * 3 o más años de experiencia en Ingeniería de Confiabilidad de Sitios (SRE), DevOps o funciones de soporte productivo para sistemas en producción * Conocimientos sobre pilas de observabilidad y monitoreo, como Grafana, Prometheus, Elastic Stack o Datadog * Conocimientos sobre sistemas Linux, con sólidas habilidades de resolución de problemas y análisis de registros * Experiencia previa en el soporte de entornos basados en Kubernetes en producción * Habilidades en soporte productivo con SQL, incluida la resolución de problemas en consultas y análisis básico de rendimiento * Competencia en la creación de scripts con Python, Bash u otros lenguajes similares para tareas de automatización y operativas * Capacidad para analizar incidencias, identificar sus causas fundamentales y contribuir a iniciativas de mejora continua * Competencia en comunicación y colaboración con equipos distribuidos y multifuncionales * Dominio del inglés a nivel intermedio-avanzado

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.