Categorías
···
Entrar / Registro

Ingeniero Senior de DevOps

Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Buscamos un Ingeniero Senior de DevOps para un puesto orientado al cliente, encargado de implementar, automatizar y optimizar plataformas de orquestación basadas en Kubernetes e infraestructuras Linux que respalden iniciativas avanzadas de IA. Aspectos destacados: 1. Implementar y optimizar plataformas de orquestación basadas en Kubernetes para IA 2. Administrar clústeres de Kubernetes habilitados para GPU y entornos Linux independientes 3. Desarrollar scripts de automatización con Python y Shell para tareas de infraestructura Buscamos un Ingeniero Senior de DevOps altamente calificado para unirse al equipo de entrega de EPAM. En este puesto orientado al cliente y centrado en la entrega, usted será responsable de la implementación práctica, la automatización y la optimización de plataformas de orquestación basadas en Kubernetes —incluido Volcano para cargas de trabajo habilitadas para GPU— y de la infraestructura Linux que respalda iniciativas avanzadas de IA e investigación. Aprovechará su profunda experiencia en administración de Kubernetes, programación de cargas de trabajo, gestión de cuotas y automatización mediante scripts en Python y Shell para ofrecer entornos informáticos eficientes, fiables y escalables. Trabajará estrechamente con otros ingenieros e investigadores para garantizar una experiencia de infraestructura fluida y de alta calidad. **Responsabilidades** * Implementar, configurar y mantener clústeres de Kubernetes habilitados para GPU y entornos informáticos Linux independientes, asegurando una programación óptima de cargas de trabajo y un rendimiento adecuado * Implementar y gestionar la programación de trabajos mediante Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas por espacio de nombres * Administrar entornos de Kubernetes de extremo a extremo, incluidos espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Desarrollar y mantener scripts de automatización en Python y Shell para agilizar el envío de trabajos, el aprovisionamiento de recursos y los informes del sistema * Colaborar con equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, la utilización de la capacidad y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y la utilización de los recursos, proporcionando retroalimentación y datos para apoyar los requisitos de optimización e informes * Identificar y recomendar mejoras en la infraestructura, las herramientas y los flujos de trabajo de automatización para potenciar el rendimiento, la escalabilidad y la usabilidad * Garantizar que los procesos operativos ofrezcan una experiencia fluida y eficiente a los investigadores que trabajan con diversas cargas de trabajo de IA y computacionales **Requisitos** * Al menos 3 años de experiencia en puestos de DevOps o ingeniería de infraestructura que respalden entornos complejos y de gran escala * Conocimientos expertos en administración y orquestación de Kubernetes, incluida la gestión de espacios de nombres, la programación y distribución de POD, las solicitudes de volúmenes persistentes (PVC), los sistemas de archivos de red (NFS) y la gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos con GPU, incluida la configuración de colas, la priorización de cargas de trabajo y la integración con Kubernetes * Experiencia demostrable en la gestión de entornos de clústeres con GPU, tanto dentro de Kubernetes como en nodos informáticos Linux independientes, para soportar cargas de trabajo de computación de alto rendimiento * Habilidades avanzadas en scripting con Python para automatizar tareas de infraestructura, envíos de trabajos e informes del sistema * Competencia en scripting con Shell de UNIX (por ejemplo, Bash) para la automatización del sistema y la eficiencia operativa * Sólidas habilidades en administración de sistemas Linux, incluida la resolución de problemas, la optimización del rendimiento y la gestión de la configuración de entornos informáticos * Comprensión sólida de los conceptos y herramientas de automatización y orquestación de infraestructura para permitir operaciones escalables y fiables * Dominio fluido del inglés (hablado y escrito) para interactuar directamente con clientes y colaborar con equipos multifuncionales **Deseable** * Experiencia con la gestión de paquetes Helm para implementar y gestionar aplicaciones en Kubernetes * Familiaridad con soluciones de monitorización y observabilidad, especialmente Prometheus, Grafana y Loki, para el seguimiento de la salud y el rendimiento de la infraestructura * Experiencia práctica con herramientas de Infraestructura como Código (IaC), como Terraform, para el aprovisionamiento y la gestión automatizados de recursos en la nube * Exposición a entornos de Kubernetes multi-nube, incluidos Amazon EKS y Google GKE, para ampliar la experiencia en orquestación * Conocimientos de redes de Azure, incluida la configuración de VPN, la instalación de ExpressRoute y la gestión de la seguridad de redes, para respaldar despliegues en la nube seguros y escalables * Familiaridad con herramientas de codificación asistida por IA (por ejemplo, GitHub Copilot, ChatGPT, Claude) para mejorar la productividad del desarrollo y la calidad del código * Experiencia en programación y optimización de recursos híbridos (nube y local) para respaldar entornos informáticos flexibles y eficientes

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.