




Resumen: Buscamos un Ingeniero DevOps intermedio para gestionar la orquestación de GPU de Kubernetes con Volcano, garantizando plataformas informáticas Linux estables para equipos de inteligencia artificial e investigación. Aspectos destacados: 1. Ejecutar la orquestación de GPU de Kubernetes con Volcano para equipos de inteligencia artificial e investigación 2. Automatizar las operaciones cotidianas con scripts en Python y shell UNIX 3. Colaborar en la construcción de una infraestructura informática eficiente y fiable Estamos contratando a un Ingeniero DevOps intermedio para ejecutar la orquestación de GPU de Kubernetes con Volcano y mantener estables las plataformas informáticas Linux destinadas a equipos de inteligencia artificial e investigación. Usted automatizará las operaciones diarias mediante scripts en Python y shell UNIX, ajustará la programación y las cuotas de recursos, y trabajará en un entorno de entrega con interacción directa con los clientes. ¡Postúlese ahora para colaborar en la construcción de una infraestructura informática eficiente y fiable! **Responsabilidades** * Provisionar y dar soporte a clústeres de Kubernetes con capacidad para GPU, así como a nodos informáticos Linux independientes, para maximizar la eficacia de la programación y el rendimiento del sistema * Operar la programación mediante Volcano configurando colas, controlando el ciclo de vida de los POD, asignando recursos GPU y aplicando controles de cuota por espacio de nombres * Mantener entornos de Kubernetes gestionando espacios de nombres, RBAC, cuotas de recursos y mecanismos de aislamiento de cargas de trabajo * Automatizar flujos operativos mediante la escritura y actualización de scripts en Python y shell para la presentación de trabajos, la asignación de recursos y la supervisión * Colaborar con equipos de orquestación, optimización y observabilidad para mejorar el rendimiento de la programación, la utilización de recursos y los resultados obtenidos por los investigadores * Analizar y reportar sobre el estado de la infraestructura y el uso de los recursos para impulsar la optimización continua * Implementar actualizaciones de la infraestructura, las herramientas y la automatización para mejorar la escalabilidad, el rendimiento y la experiencia del usuario * Apoyar los procesos operativos que garanticen un entorno eficaz para proyectos de inteligencia artificial y computacionales destinados a los investigadores **Requisitos** * Experiencia práctica de 2+ años en DevOps o ingeniería de infraestructura en entornos complejos y de gran escala * Conocimientos sólidos sobre operaciones de Kubernetes, incluidos espacios de nombres, ubicación y equilibrio de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica operando Volcano para cargas de trabajo GPU, incluida la creación de colas, el manejo de prioridades y la integración con Kubernetes * Experiencia demostrable gestionando clústeres GPU tanto en entornos Kubernetes como en configuraciones Linux independientes utilizadas para computación de alto rendimiento * Capacidad avanzada en scripting con Python para automatizar tareas de infraestructura, procesamiento de trabajos y flujos de supervisión * Dominio sólido del scripting en shell UNIX (Bash o similar) para automatizar rutinas del sistema y mejorar las operaciones * Habilidades sólidas en administración de Linux, incluida la resolución de problemas, ajuste de rendimiento y gestión de configuraciones * Comprensión profunda de los conceptos y herramientas de automatización y orquestación para una infraestructura fiable y escalable * Excelentes habilidades comunicativas en inglés (hablado y escrito) para interactuar directamente con clientes y equipos multifuncionales **Deseable** * Experiencia con Helm para empaquetado y lanzamiento de aplicaciones en Kubernetes * Conocimientos de observabilidad con Prometheus, Grafana y Loki para la supervisión de infraestructura * Familiaridad con Terraform para Infraestructura como Código y automatización de recursos en la nube * Experiencia con Amazon EKS y Google GKE en entornos Kubernetes multi-nube * Conocimientos de redes Azure, incluidas VPN, ExpressRoute y seguridad de red * Uso de asistentes de codificación basados en IA, tales como GitHub Copilot, ChatGPT y Claude, para mejorar la calidad del código y la productividad * Conocimientos sobre programación híbrida y optimización entre recursos informáticos locales y en la nube


