Categorías
···
Entrar / Registro
Ingeniero Senior de DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un Ingeniero Senior de DevOps para automatizar, escalar y optimizar plataformas robustas de Kubernetes y Linux listas para GPU destinadas a cargas de trabajo de IA e investigación dentro de un equipo de entrega. Aspectos destacados: 1. Construcción de plataformas robustas de Kubernetes y Linux listas para GPU 2. Automatización y optimización de la orquestación para cargas de trabajo de IA/investigación 3. Colaboración para mejorar la eficiencia de la programación y los flujos de trabajo de los investigadores Estamos construyendo plataformas robustas de Kubernetes y Linux listas para GPU, y necesitamos un Ingeniero Senior de DevOps para automatizar, escalar y optimizar la orquestación. Usted gestionará la administración de Kubernetes con la programación Volcano, cuotas y aislamiento, mientras automatiza mediante Python y Bash para cargas de trabajo de IA e investigación. Únase a nuestro equipo de entrega y postúlese hoy mismo **Responsabilidades** * Implementar, configurar y mantener clústeres de Kubernetes habilitados para GPU y entornos informáticos Linux independientes para garantizar una programación y un rendimiento óptimos * Implementar y operar la programación de trabajos Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas por espacio de nombres * Administrar Kubernetes de extremo a extremo, abarcando espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Desarrollar y mantener automatizaciones en Python y Shell para simplificar el envío de trabajos, el aprovisionamiento de recursos y los informes del sistema * Colaborar con equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, la utilización de la capacidad y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y el uso de los recursos, proporcionando datos y retroalimentación para requisitos de optimización e informes * Identificar y proponer mejoras en la infraestructura, las herramientas y los flujos de trabajo de automatización para incrementar el rendimiento, la escalabilidad y la usabilidad * Garantizar que los procesos operativos ofrezcan a los investigadores una experiencia fluida y eficiente en diversas cargas de trabajo de IA y computacionales **Requisitos** * Al menos 3 años de experiencia en DevOps o ingeniería de infraestructura en entornos complejos y de gran escala * Competencias expertas en la administración de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos GPU, incluida la configuración de colas y la priorización de cargas de trabajo con integración en Kubernetes * Capacidad comprobada para operar entornos de clústeres GPU en Kubernetes, así como en nodos informáticos Linux independientes * Conocimientos avanzados de scripting en Python para la automatización de infraestructuras, además de habilidades en scripting UNIX Shell, tales como Bash * Amplia experiencia en la administración de sistemas Linux, incluida la solución de problemas, la optimización del rendimiento y la gestión de la configuración * Comprensión sólida de los conceptos y herramientas relacionados con la automatización y la orquestación de infraestructuras * Dominio fluido del inglés (hablado y escrito) para la interacción directa con clientes **Deseable** * Conocimientos sobre la gestión de paquetes Helm para aplicaciones de Kubernetes * Familiaridad con soluciones de monitorización y observabilidad, especialmente Prometheus, Grafana y Loki * Habilidades en herramientas de Infraestructura como Código (IaC), tales como Terraform * Experiencia previa en entornos de Kubernetes multi-nube, incluidos Amazon EKS y Google GKE * Conocimientos sobre redes de Azure, incluidas VPN, ExpressRoute y seguridad de red * Familiaridad con herramientas de codificación asistida por IA, tales como GitHub Copilot, ChatGPT y Claude * Experiencia en programación y optimización de recursos híbridos (nube y locales)

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.