Categorías
···
Entrar / Registro
Ingeniero DevOps intermedio
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un Ingeniero DevOps intermedio para automatizar y optimizar plataformas Kubernetes para cargas de trabajo con GPU y la infraestructura Linux, colaborando con ingenieros e investigadores. Aspectos destacados: 1. Automatizar y optimizar plataformas Kubernetes para cargas de trabajo con GPU 2. Implementar y dar soporte a la programación basada en Volcano y las operaciones del clúster 3. Proporcionar entornos informáticos fiables y escalables para la investigación en inteligencia artificial Buscamos un Ingeniero DevOps intermedio para automatizar y optimizar plataformas Kubernetes para cargas de trabajo con GPU y la infraestructura Linux detrás de la investigación en inteligencia artificial. Implementará y dará soporte a la programación basada en Volcano, cuotas y operaciones del clúster mediante scripts en Python y shell UNIX, colaborando con ingenieros e investigadores. Postúlese para ayudar a proporcionar entornos informáticos fiables y escalables **Responsabilidades** * Implementar, configurar y dar soporte a clústeres Kubernetes habilitados para GPU y sistemas informáticos Linux independientes para mejorar la programación y la eficiencia general * Administrar la programación Volcano configurando colas, gestionando PODs, asignando recursos GPU y aplicando controles de cuota por espacio de nombres * Gestionar la plataforma Kubernetes en todos los espacios de nombres, RBAC, cuotas de recursos y enfoques de aislamiento de cargas de trabajo * Desarrollar y mantener automatizaciones en Python y Shell para simplificar el envío de trabajos, la asignación de recursos y la supervisión de la infraestructura * Colaborar con equipos de orquestación, optimización y observabilidad para incrementar el rendimiento de la programación, la utilización de recursos y la productividad de los investigadores * Supervisar la salud de la infraestructura y el consumo de recursos, y compartir métricas para guiar la optimización y los informes * Proponer y entregar mejoras en la infraestructura, herramientas y procesos de automatización para potenciar la escalabilidad, el rendimiento y la experiencia del usuario * Dar soporte a rutinas operativas que brinden a los investigadores un entorno fluido para cargas de trabajo de inteligencia artificial y computacionales **Requisitos** * Experiencia profesional de 2\+ años en DevOps o ingeniería de infraestructura, dando soporte a sistemas complejos y de gran escala * Conocimientos profundos en administración y orquestación de Kubernetes, incluidos espacios de nombres, programación y equilibrio de PODs, PVC, NFS y controles de cuota de recursos * Experiencia práctica con el programador Volcano para la gestión de trabajos con GPU, abarcando la configuración de colas, la priorización de cargas de trabajo y la integración con Kubernetes * Capacidad comprobada para ejecutar entornos de clústeres con GPU en configuraciones Kubernetes y Linux independientes para computación de alto rendimiento * Habilidades avanzadas en scripting Python para automatizar operaciones de infraestructura, manejo de trabajos y supervisión del sistema * Competencia práctica en scripting UNIX Shell (por ejemplo, Bash) para automatizar tareas del sistema y agilizar flujos de trabajo operativos * Amplia experiencia en administración de sistemas Linux, incluida la resolución de problemas, la optimización del rendimiento y la gestión de configuraciones * Comprensión exhaustiva de herramientas y conceptos de automatización y orquestación para construir infraestructuras escalables y fiables * Excelentes habilidades de comunicación en inglés (hablado y escrito) para interactuar directamente con clientes y colaborar entre equipos **Deseable** * Experiencia con Helm para empaquetar y gestionar aplicaciones Kubernetes * Conocimientos de herramientas de monitorización y observabilidad como Prometheus, Grafana y Loki para rastrear la salud y el rendimiento * Familiaridad con herramientas de Infraestructura como Código (IaC), como Terraform, para el aprovisionamiento y la gestión automatizados en la nube * Experiencia con plataformas Kubernetes multi-nube, incluidas Amazon EKS y Google GKE * Conocimientos sobre redes de Azure, incluida la configuración de VPN, ExpressRoute y seguridad de red * Experiencia utilizando asistentes de codificación de IA (GitHub Copilot, ChatGPT, Claude) para mejorar la velocidad de desarrollo y la calidad del código * Comprensión de la programación híbrida y la optimización de recursos en entornos cloud y locales

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.