Categorías
···
Entrar / Registro
Ingeniero Líder de Plataforma AWS (Habilitación HPC)
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Como Ingeniero Líder de Plataforma AWS, fortalecerá nuestra plataforma en la nube mediante la estandarización de las bases multi-cuenta de AWS y Kubernetes mediante automatización, observabilidad y patrones escalables. Aspectos destacados: 1. Gestionar el entorno de AWS y ejecutar operaciones de plataforma para cargas de trabajo HPC 2. Liderar la propiedad técnica y establecer estándares en todos los equipos 3. Diseñar y dar soporte a soluciones de transferencia de datos entre nubes Estamos construyendo una plataforma confiable de AWS para que los equipos HPC ejecuten cargas de trabajo a gran escala con fiabilidad y control constantes. Como **Ingeniero Líder de Plataforma AWS** (Habilitación HPC), usted estandarizará las bases multi-cuenta de AWS y Kubernetes mediante automatización, observabilidad y patrones escalables: ¡postúlese para ayudar a fortalecer nuestra plataforma en la nube! **Responsabilidades** * Gestionar el entorno de AWS y ejecutar operaciones de plataforma que permitan cargas de trabajo HPC a escala * Provisionar y administrar cuentas de AWS mediante herramientas internas de autoservicio y patrones estandarizados * Desarrollar y mantener código Terraform para aprovisionar recursos de AWS y clústeres orientados a HPC * Diseñar y ejecutar canalizaciones centralizadas de CI/CD para gestionar todas las cuentas y clústeres desde un único repositorio * Migrar las cuentas restantes de AWS al repositorio central y alinearlas con los patrones estandarizados de infraestructura * Operar y dar soporte al registro de contenedores dentro del clúster (Harbor) y a los componentes asociados de la plataforma * Implementar y finalizar la implementación de la observabilidad en todo el entorno de AWS, cubriendo métricas, registros, paneles y alertas * Dar soporte a las operaciones de clústeres de Kubernetes y solucionar problemas de plataforma que afecten a las cargas de trabajo HPC * Gestionar y mejorar Cast AI como mecanismo principal para el escalado y la optimización de clústeres * Diseñar y dar soporte a soluciones de transferencia de datos y redes entre nubes, como AWS DataSync y la interconexión entre AWS y GCP * Colaborar con el equipo HPC para traducir requisitos en soluciones de plataforma implementadas * Coordinar los horarios de trabajo para mantener al menos 4 horas de superposición con la zona horaria de Houston y, ocasionalmente, con la de Australia **Requisitos** * Experiencia práctica con Amazon Web Services en entornos multi-cuenta (5+ años) * Conocimientos avanzados de infraestructura como código con Terraform (HCL/tofu), incluidos módulos y gestión de estado * Experiencia en operaciones de Kubernetes, incluida la solución de problemas de clústeres y cargas de trabajo * Capacidad demostrada para liderar la propiedad técnica como colaborador individual de nivel senior y establecer estándares en todos los equipos * Excelentes habilidades de entrega de proyectos para transformar requisitos en opciones evaluadas y soluciones desplegadas con mínima supervisión * Conocimientos avanzados de programación en Python para automatización, desarrollo de herramientas e integraciones * Conocimientos sólidos de scripting en Bash para automatización operativa * Conocimientos sólidos de flujos de trabajo de CI/CD y GitOps utilizando herramientas como GitLab CI o GitHub Actions * Capacidad avanzada en observabilidad, abarcando métricas, registros, paneles y alertas, con Prometheus y Grafana * Experiencia en la mejora del escalado de clústeres y la optimización de costos mediante Cast AI u otras herramientas similares * Capacidad para utilizar herramientas asistidas por IA para generación de código, depuración y documentación en el trabajo diario * Nivel de inglés intermedio-alto (CEFR B2) **Deseable** * Experiencia con Google Cloud Platform, especialmente en integraciones entre nubes con AWS * Antecedentes en computación de alto rendimiento (HPC), incluidos planificadores o tuberías intensivas en datos

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.