Categorías
···
Entrar / Registro
Ingeniero Senior de DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un Ingeniero Senior de DevOps para asumir la administración de Kubernetes, implementar colas Volcano y automatizar operaciones con el fin de optimizar los entornos informáticos compartidos para equipos de IA e investigación. Aspectos destacados: 1. Administración propia de Kubernetes para equipos de IA e investigación 2. Implementación de colas Volcano y automatización de operaciones diarias 3. Optimización a gran escala de entornos informáticos compartidos Gestionamos infraestructura de Kubernetes y Linux con GPU para equipos de IA e investigación, poniendo énfasis en la automatización, la precisión de la programación y la fiabilidad a gran escala. En este puesto de Ingeniero Senior de DevOps, usted asumirá la administración de Kubernetes, implementará colas y políticas Volcano y automatizará las operaciones diarias mediante scripts en Python y shell UNIX. ¡Postúlese ahora para ayudar a optimizar los entornos informáticos compartidos! **Responsabilidades** * Implementar y mantener clústeres de Kubernetes habilitados para GPU y entornos informáticos Linux independientes para respaldar una programación confiable de cargas de trabajo y un rendimiento óptimo * Configurar y ejecutar la programación de trabajos con Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas de espacio de nombres * Gestionar entornos de Kubernetes de extremo a extremo, incluidos espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Automatizar el envío de trabajos, el aprovisionamiento de recursos y la generación de informes del sistema mediante el desarrollo de scripts en Python y Shell * Colaborar con los equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, la utilización de la capacidad y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y la utilización de los recursos, proporcionando datos para cumplir con los requisitos de optimización e informes * Mejorar la infraestructura, las herramientas y los flujos de trabajo de automatización para potenciar el rendimiento, la escalabilidad y la usabilidad * Apoyar los procesos operativos que garanticen una experiencia fluida para los investigadores que ejecutan diversas cargas de trabajo de IA y computacionales **Requisitos** * Experiencia mínima de 3 años en DevOps o ingeniería de infraestructura en entornos complejos y a gran escala * Conocimientos expertos en administración y orquestación de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica con Volcano para la ejecución de trabajos con GPU, configuración de colas, priorización de cargas de trabajo e integración con Kubernetes * Experiencia comprobada gestionando entornos de clústeres con GPU en Kubernetes y en nodos informáticos Linux independientes * Habilidades avanzadas de programación en Python para la automatización de infraestructuras, junto con conocimientos sólidos de programación en shell UNIX (por ejemplo, Bash) * Conocimientos sólidos de administración de sistemas Linux, incluidos resolución de problemas, ajuste de rendimiento y gestión de configuraciones * Comprensión sólida de los conceptos y herramientas relacionados con la automatización y la orquestación de infraestructuras * Capacidad comprobada para comunicarse con fluidez en inglés (hablado y escrito) para interactuar directamente con clientes **Deseable** * Helm para la gestión de paquetes en Kubernetes * Prometheus, Grafana y Loki para monitoreo y observabilidad * Terraform para Infraestructura como Código * Experiencia previa con Kubernetes multi-nube, incluidos Amazon EKS y Google GKE * Conocimientos de redes de Azure, incluidas VPN, ExpressRoute y seguridad de red * Experiencia con herramientas de programación asistida por IA (por ejemplo, GitHub Copilot, ChatGPT, Claude) * Experiencia en programación híbrida (nube + local) y optimización de recursos

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.