




Resumen: Buscamos un Ingeniero Líder de DevOps para asumir la propiedad y evolucionar una plataforma en AWS destinada a servicios personalizados de VDI y pruebas en la nube, impulsando la infraestructura como código, las operaciones de ECS/EKS y los estándares de CI/CD. Aspectos destacados: 1. Liderar DevOps para servicios personalizados de VDI y pruebas en la nube en AWS 2. Impulsar la infraestructura como código y optimizar el costo/rendimiento de las instancias EC2 con GPU 3. Liderar la respuesta a incidentes y garantizar la fiabilidad y escalabilidad de la plataforma Estamos creando un puesto de **Ingeniero Líder de DevOps** para asumir la propiedad y evolucionar la plataforma en AWS que sustenta una solución personalizada de VDI y servicios de pruebas en la nube/transmisión. Usted impulsará la infraestructura\-como\-código, las operaciones de ECS/EKS, la automatización con AWS Lambda y los estándares de CI/CD mediante GitHub Actions, mientras optimiza el costo/rendimiento de las instancias EC2 con GPU y lidera la respuesta a incidentes en toda la plataforma. ¡Postúlese ahora para ayudar a mantener la plataforma fiable, eficiente y escalable! **Responsabilidades** * Diseñar, construir y mantener la infraestructura en AWS con Terraform * Gestionar flujos de trabajo de Terraform y estado remoto mediante HashiCorp Cloud Platform (HCP) * Asumir la responsabilidad del ciclo de vida completo de la infraestructura, incluidos el aprovisionamiento, las actualizaciones, la desactivación y la higiene operativa * Operar clústeres de ECS para implementar y ejecutar microservicios que soporten las plataformas * Administrar clústeres de EKS que alojen y habiliten ejecutores de GitHub Actions, incluidas las personalizaciones necesarias de la plataforma * Optimizar y ajustar correctamente la capacidad de instancias EC2 con GPU para cumplir los objetivos de experiencia de usuario bajo controles estrictos de costos en la nube * Evaluar continuamente el comportamiento de escalado, supervisar la utilización e identificar cuellos de botella de rendimiento * Implementar y mantener funciones de AWS Lambda que automatizan tareas de limpieza, aprovisionamiento bajo demanda y flujos de trabajo operativos * Normalizar y mejorar las canalizaciones de GitHub Actions para los flujos de trabajo de planificación/aplicación de Terraform, lanzamientos de infraestructura y procesos de construcción/publicación/implantación de imágenes de contenedores * Liderar la resolución de problemas y la restauración del servicio ante degradaciones generalizadas de la plataforma, tales como caídas de sesiones de VDI, problemas de autenticación y fallos de máquinas o almacenamiento * Coordinar la resolución de incidentes entre equipos impulsando la investigación, la mitigación y las acciones de seguimiento * Crear y mantener actualizados libros de procedimientos operativos, documentación operativa y materiales de incorporación **Requisitos** * Experiencia comprobada de 7\+ años en roles de DevOps o ingeniería de plataformas * Conocimientos profundos sobre arquitectura, aprovisionamiento y gestión integral del ciclo de vida de la infraestructura en AWS * Competencia práctica con Terraform y HashiCorp Cloud Platform (HCP) * Experiencia sólida operando orquestación de contenedores mediante ECS y EKS * Amplios conocimientos sobre ajuste correcto de instancias EC2 con GPU, gestión de costos en la nube y afinación de rendimiento * Competencia práctica con AWS Lambda para automatización basada en eventos * Antecedentes demostrables en la normalización de CI/CD mediante canalizaciones de GitHub Actions * Trayectoria comprobada liderando ingeniería de fiabilidad, resolución de problemas y respuesta a incidentes * Alto sentido de propiedad y responsabilidad, con capacidad para trabajar de forma independiente sin supervisión directa * Habilidades sólidas de resolución de problemas y pensamiento sistémico, manteniendo la calma y el método durante los incidentes * Habilidades claras de comunicación con partes interesadas técnicas y no técnicas * Capacidad efectiva para priorizar tareas dentro de un flujo de trabajo Kanban, equilibrando el trabajo planificado con interrupciones urgentes * Dominio del inglés al nivel B2 (intermedio alto) o superior **Deseable** * Familiaridad con Amazon GameLift Streams * Comprensión de las necesidades de plataformas de transmisión y pruebas * Capacidad para diagnosticar y atender solicitudes urgentes y puntuales que queden fuera del flujo Kanban estándar **Ofrecemos** * Proyectos internacionales con marcas líderes * Trabajo con equipos globales de colegas altamente cualificados y diversos * Beneficios médicos * Programas financieros para empleados * Días de vacaciones pagados y licencias por enfermedad * Cursos de actualización de competencias, reconversión profesional y certificaciones * Acceso ilimitado a la biblioteca de LinkedIn Learning y a más de 22.000 cursos * Oportunidades profesionales globales * Oportunidades de voluntariado y participación comunitaria * Grupos de empleados de EPAM * Cultura galardonada reconocida por Glassdoor, Newsweek y LinkedIn


