Categorías
···
Entrar / Registro
Ingeniero Senior de DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un Ingeniero Senior de DevOps para dirigir la implementación, automatización y optimización de plataformas de orquestación basadas en Kubernetes para iniciativas de IA e investigación. Aspectos destacados: 1. Dirigir la implementación y optimización de Kubernetes para cargas de trabajo de IA. 2. Aprovechar la experiencia en administración y automatización de Kubernetes. 3. Colaborar en la eficiencia de la programación, la capacidad y los flujos de trabajo de los investigadores. Estamos buscando un **Ingeniero Senior de DevOps** altamente calificado para unirse al equipo de entrega de EPAM. En este puesto, usted dirigirá la implementación, automatización y optimización de plataformas de orquestación basadas en Kubernetes, incluido Volcano para cargas de trabajo habilitadas para GPU, y gestionará la infraestructura Linux para iniciativas avanzadas de IA e investigación. Aprovechará su profunda experiencia en administración de Kubernetes, programación de cargas de trabajo, gestión de cuotas de recursos y automatización mediante scripts en Python y Shell para ofrecer entornos informáticos eficientes, fiables y escalables en un entorno centrado en la entrega y orientado al cliente. **Responsabilidades** * Implementar, configurar y mantener clústeres de Kubernetes habilitados para GPU y entornos informáticos Linux independientes, garantizando una programación óptima de cargas de trabajo y un rendimiento adecuado * Implementar y gestionar la programación de trabajos con Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas de espacio de nombres * Administrar entornos de Kubernetes de extremo a extremo, incluidos espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Desarrollar y mantener scripts de automatización en Python y Shell para simplificar el envío de trabajos, el aprovisionamiento de recursos y la generación de informes del sistema * Colaborar con equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, la utilización de la capacidad y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y la utilización de los recursos, proporcionando retroalimentación y datos para apoyar los requisitos de optimización e informes * Identificar y recomendar mejoras en la infraestructura, las herramientas y los flujos de trabajo de automatización para potenciar el rendimiento, la escalabilidad y la usabilidad * Garantizar que los procesos operativos ofrezcan una experiencia fluida y eficiente a los investigadores en diversas cargas de trabajo de IA y computacionales **Requisitos** * Mínimo 3 años de experiencia en puestos de DevOps o ingeniería de infraestructura en entornos complejos y de gran escala * Competencia experta en administración y orquestación de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos GPU, configuración de colas, priorización de cargas de trabajo e integración con Kubernetes * Experiencia comprobada gestionando entornos de clústeres GPU tanto en Kubernetes como en nodos informáticos Linux independientes * Habilidades avanzadas de programación en Python para automatización de infraestructura, además de competencia en scripting UNIX Shell (por ejemplo, Bash) * Conocimientos sólidos de administración de sistemas Linux, incluida la resolución de problemas, la optimización del rendimiento y la gestión de la configuración * Comprensión sólida de los conceptos y herramientas de automatización y orquestación de infraestructura * Dominio fluido del inglés (hablado y escrito) para la interacción directa con clientes **Deseable** * Gestión de paquetes Helm para aplicaciones de Kubernetes * Soluciones de supervisión y observabilidad, especialmente Prometheus, Grafana y Loki * Herramientas de Infraestructura como Código (IaC), como Terraform * Experiencia con Kubernetes multi-nube (Amazon EKS, Google GKE) * Conocimientos de redes de Azure, incluidas VPN, ExpressRoute y seguridad de red * Familiaridad con herramientas de programación asistida por IA (por ejemplo, GitHub Copilot, ChatGPT, Claude) * Experiencia en programación y optimización de recursos híbridos (nube + local)

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.