




Resumen: Buscamos un Ingeniero Principal de Confiabilidad de Sitios experimentado para liderar iniciativas de confiabilidad de infraestructura, guiar a un equipo y promover la excelencia operativa en plataformas basadas en la nube. Puntos destacados: 1. Liderar el diseño y la evolución de una infraestructura resistente y escalable 2. Ser mentor y guiar a un equipo de ingenieros, fomentando su crecimiento técnico 3. Definir la estrategia técnica y promover la excelencia operativa Buscamos un **Ingeniero Principal de Confiabilidad de Sitios** experimentado para liderar nuestras iniciativas de confiabilidad de infraestructura y guiar a un equipo de ingenieros talentosos. En este puesto, usted definirá la estrategia técnica, actuará como mentor de los miembros del equipo y promoverá la excelencia operativa en nuestras plataformas basadas en la nube y servicios distribuidos. EPAM es un proveedor global líder en ingeniería y desarrollo de plataformas digitales. Nos comprometemos a generar un impacto positivo en nuestros clientes, empleados y comunidades. Adoptamos una cultura dinámica e inclusiva. Aquí colaborará con equipos multinacionales, contribuirá a una gran variedad de proyectos innovadores que ofrecen soluciones creativas y de vanguardia, y tendrá la oportunidad de aprender y crecer continuamente. Sin importar su ubicación geográfica, se unirá a una comunidad dedicada, creativa y diversa que lo ayudará a descubrir todo su potencial. **Responsabilidades** * Liderar el diseño y la evolución de una infraestructura resistente y escalable en múltiples proveedores de nube * Ser mentor y guiar a un equipo de ingenieros, fomentando su crecimiento técnico y las mejores prácticas * Definir estándares de confiabilidad, objetivos de nivel de servicio (SLO) y políticas operativas para entornos de producción * Diseñar marcos de automatización para agilizar despliegues y la gestión de infraestructura * Supervisar la estrategia de CI/CD y garantizar flujos de trabajo eficientes para la entrega de software * Coordinar los esfuerzos de respuesta ante incidentes y liderar análisis posteriores al incidente (post-mortem) para prevenir su recurrencia * Colaborar con la dirección técnica para alinear los objetivos de confiabilidad con las prioridades comerciales * Promover prácticas de observabilidad para mejorar la visibilidad del sistema y la detección proactiva de problemas * Brindar orientación técnica para iniciativas de arquitectura de microservicios y orientada a eventos * Evaluar herramientas y tecnologías emergentes para fortalecer el ecosistema de confiabilidad * Impulsar la planificación de capacidad, la optimización de costos y el ajuste del rendimiento en las plataformas **Requisitos** * 5 o más años de experiencia en DevOps o Ingeniería de Confiabilidad de Sitios (SRE) * Experiencia avanzada en AWS, Azure y GCP * Competencia en Kubernetes, Terraform y Ansible * Habilidades en GitHub y Jenkins * Conocimientos sobre microservicios, APIs y procesamiento orientado a eventos * Excelentes habilidades de comunicación escrita y oral en inglés (nivel B2+) **Ofrecemos** * Bono de conectividad (25.000 ARS se pagan junto con la nómina mensual como concepto no salarial). * Medicina prepaga (cubre al colaborador y a su grupo familiar directo). * Licencia por paternidad (se suman dos días adicionales a los establecidos por ley, para un total de 4 días). * Tarjeta de descuentos. * Capacitación en inglés (clases semanales, dos veces por semana). * Programa de capacitación (acceso a múltiples planes formativos personalizados según las necesidades de cada rol dentro de la empresa). * Bono por matrimonio (la empresa duplica la asignación establecida por ley que ofrece ANSES). * Programa de referidos (el bono por referido se paga cuando la persona referida se incorpora a la empresa). * Acuerdos externos y descuentos. * Vacaciones: 14 días corridos al año *Al postularse a este puesto, usted acepta que sus datos personales puedan ser utilizados según lo establecido en la Nota de Privacidad y Política de EPAM.*


