Categorías
···
Entrar / Registro
Ingeniero Senior de DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un Ingeniero Senior de DevOps para automatizar, escalar y optimizar plataformas robustas de Kubernetes y Linux listas para GPU destinadas a cargas de trabajo de IA e investigación dentro de un equipo de entrega. Aspectos destacados: 1. Construcción de plataformas robustas de Kubernetes y Linux listas para GPU 2. Automatización y optimización de la orquestación para cargas de trabajo de IA e investigación 3. Colaboración para mejorar la eficiencia de la programación y la utilización de la capacidad Estamos construyendo plataformas robustas de Kubernetes y Linux listas para GPU y necesitamos un Ingeniero Senior de DevOps para automatizar, escalar y optimizar la orquestación. Usted gestionará la administración de Kubernetes con programación mediante Volcano, cuotas y aislamiento, además de automatizar con Python y Bash para cargas de trabajo de IA e investigación. Únase a nuestro equipo de entrega y postúlese hoy mismo **Responsabilidades** * Implementar, configurar y mantener clústeres de Kubernetes habilitados para GPU y entornos informáticos Linux independientes para garantizar una programación y un rendimiento óptimos * Implementar y operar la programación de trabajos mediante Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas por espacio de nombres * Administrar Kubernetes de extremo a extremo, cubriendo espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Desarrollar y mantener automatizaciones en Python y Shell para simplificar la presentación de trabajos, el aprovisionamiento de recursos y los informes del sistema * Colaborar con equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, la utilización de la capacidad y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y el uso de los recursos, proporcionando datos y retroalimentación para requisitos de optimización e informes * Identificar y proponer mejoras en la infraestructura, las herramientas y los flujos de trabajo de automatización para incrementar el rendimiento, la escalabilidad y la usabilidad * Garantizar que los procesos operativos ofrezcan a los investigadores una experiencia fluida y eficiente en diversas cargas de trabajo de IA y computacionales **Requisitos** * Al menos 3 años de experiencia en DevOps o ingeniería de infraestructura en entornos complejos y de gran escala * Competencias expertas en la administración de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos con GPU, incluida la configuración de colas y la priorización de cargas de trabajo con integración en Kubernetes * Capacidad comprobada para operar entornos de clústeres con GPU en Kubernetes, así como en nodos informáticos Linux independientes * Conocimientos avanzados de scripting en Python para la automatización de infraestructura, además de habilidades en scripting UNIX Shell, como Bash * Sólidas capacidades de administración de sistemas Linux, incluidas la resolución de problemas, la optimización del rendimiento y la gestión de configuraciones * Comprensión sólida de los conceptos y herramientas relacionados con la automatización y la orquestación de infraestructuras * Dominio fluido del inglés (hablado y escrito) para la interacción directa con clientes **Deseable** * Conocimientos sobre la gestión de paquetes Helm para aplicaciones de Kubernetes * Familiaridad con soluciones de monitorización y observabilidad, especialmente Prometheus, Grafana y Loki * Competencias en herramientas de Infraestructura como Código (IaC), como Terraform * Experiencia en entornos de Kubernetes multi-nube, incluidos Amazon EKS y Google GKE * Conocimientos sobre redes de Azure, incluidas VPN, ExpressRoute y seguridad de red * Familiaridad con herramientas de codificación asistida por IA, como GitHub Copilot, ChatGPT y Claude * Experiencia en la programación y la optimización de recursos híbridos (nube y locales)

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.