Categorías
···
Entrar / Registro

Ingeniero DevOps Intermedio

Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Buscamos un Ingeniero DevOps Intermedio para gestionar la administración de Kubernetes y clústeres GPU, centrado en la programación con Volcano y en operaciones automatizadas de infraestructura destinadas a entornos de computación de IA estables y eficientes. Aspectos destacados: 1. Gestionar la administración de Kubernetes y clústeres GPU en plataformas Linux 2. Automatizar con scripts en Python/UNIX shell para entregas dirigidas al cliente 3. Entregar entornos de computación de IA estables y eficientes a escala Estamos habilitando una computación GPU fiable mediante la operación de plataformas Kubernetes y Linux centradas en la programación con Volcano y en operaciones automatizadas de infraestructura. Como Ingeniero DevOps Intermedio, gestionarás la administración de Kubernetes, ejecutarás clústeres GPU sobre nodos Kubernetes y Linux, y crearás automatizaciones con Python y scripts de shell UNIX para un equipo de entrega dirigido al cliente. Postúlate para ayudar a entregar entornos de computación de IA estables y eficientes a escala. **Responsabilidades** * Aprovisionar, configurar y operar clústeres Kubernetes habilitados para GPU y entornos de computación Linux independientes para mantener optimizada la programación y el rendimiento * Configurar y administrar la programación de trabajos con Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas de espacio de nombres * Asumir la responsabilidad de la administración de Kubernetes en todos los espacios de nombres, RBAC, cuotas de recursos y enfoques de aislamiento de cargas de trabajo * Automatizar la presentación de trabajos, el aprovisionamiento de recursos y los informes del sistema mediante la creación y mantenimiento de scripts en Python y Shell * Coordinarse con los equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, incrementar la utilización de la capacidad y simplificar los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y la utilización de recursos, proporcionando datos y retroalimentación para necesidades de optimización e informes * Mejorar la infraestructura, las herramientas y los flujos de trabajo de automatización para aumentar el rendimiento, la escalabilidad y la usabilidad * Mantener procesos operativos que brinden una experiencia fluida y eficiente a los investigadores que ejecutan diversas cargas de trabajo de IA y computacionales **Requisitos** * Experiencia práctica de 2 o más años en DevOps o ingeniería de infraestructura dentro de entornos complejos y de gran escala * Conocimientos especializados en administración y orquestación de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos GPU, configuración de colas y priorización de cargas de trabajo integrada con Kubernetes * Capacidad comprobada para operar entornos de clústeres GPU tanto en Kubernetes como en nodos de computación Linux independientes * Habilidades avanzadas en scripting con Python para automatización de infraestructura, además de competencia en scripting con shell UNIX, como Bash * Sólidas habilidades en administración de sistemas Linux, incluidas la solución de problemas, la optimización del rendimiento y la gestión de configuraciones * Comprensión sólida de los conceptos de automatización y orquestación de infraestructura y de las herramientas relacionadas * Dominio fluido del inglés (hablado y escrito) para interacción directa con clientes **Deseable** * Conocimientos sobre la gestión de paquetes Helm para aplicaciones de Kubernetes * Familiaridad con soluciones de monitoreo y observabilidad, especialmente Prometheus, Grafana y Loki * Competencias en herramientas de Infraestructura como Código (IaC), como Terraform * Experiencia en entornos Kubernetes multi-nube, incluidos Amazon EKS y Google GKE * Conocimientos sobre redes de Azure, incluidas VPN, ExpressRoute y seguridad de red * Familiaridad con herramientas de codificación asistida por IA, como GitHub Copilot, ChatGPT y Claude * Experiencia en programación y optimización de recursos híbridos (nube y locales)

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR

Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.