Categorías
···
Entrar / Registro

Ingeniero Senior de DevOps

Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Este puesto implica gestionar las operaciones de Kubernetes y la infraestructura Linux para investigaciones en IA intensivas en GPU, centrándose en la automatización y la optimización del rendimiento y el uso de la capacidad. Aspectos destacados: 1. Operar clústeres de Kubernetes con GPU para investigación en IA 2. Automatizar flujos de trabajo con Python y Shell para mejorar la eficiencia 3. Ajustar los nodos de cómputo Linux para un rendimiento óptimo Estamos implementando una orquestación automatizada de Kubernetes y una infraestructura Linux que potencia investigaciones en IA intensivas en GPU, utilizando Volcano para gestionar programaciones complejas. Usted se encargará de las operaciones de Kubernetes (espacios de nombres, RBAC, cuotas), ajustará los nodos de cómputo Linux y desarrollará automatizaciones en Python y Bash para mejorar la fiabilidad y el uso de la capacidad; ¡postule ahora! **Responsabilidades** * Operar clústeres de Kubernetes con GPU y entornos de cómputo Linux independientes para garantizar una programación eficiente y un rendimiento constante * Configurar y gestionar la programación de trabajos con Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas por espacio de nombres * Mantener plataformas de Kubernetes de extremo a extremo, cubriendo espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Automatizar flujos de trabajo recurrentes mediante scripts en Python y Shell para la presentación de trabajos, el aprovisionamiento de recursos y los informes del sistema * Coordinarse con los equipos de orquestación, optimización y observabilidad para perfeccionar la eficiencia de la programación, la utilización y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y la utilización de los recursos, y proporcionar retroalimentación para requisitos de optimización e informes * Recomendar actualizaciones de la infraestructura, las herramientas y los flujos de trabajo de automatización para incrementar el rendimiento, la escalabilidad y la usabilidad * Mantener procesos operativos que permitan una experiencia fluida para los investigadores en cargas de trabajo de IA y computacionales **Requisitos** * Al menos 3 años de experiencia en puestos de DevOps o ingeniería de infraestructura que respalden entornos complejos y a gran escala * Competencia experta en administración y orquestación de Kubernetes, incluida la gestión de espacios de nombres, programación y distribución de POD, reclamaciones de volúmenes persistentes (PVC), sistemas de archivos en red (NFS) y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos con GPU, incluida la configuración de colas, la priorización de cargas de trabajo y la integración con Kubernetes * Experiencia comprobada en la gestión de entornos de clústeres con GPU, tanto dentro de Kubernetes como en nodos de cómputo Linux independientes, para soportar cargas de trabajo de computación de alto rendimiento * Habilidades avanzadas en scripting con Python para automatizar tareas de infraestructura, presentación de trabajos e informes del sistema * Competencia en scripting con UNIX Shell (por ejemplo, Bash) para la automatización del sistema y la eficiencia operativa * Sólidas habilidades en administración de sistemas Linux, incluidas la resolución de problemas, la optimización del rendimiento y la gestión de la configuración para entornos de cómputo * Comprensión sólida de los conceptos y herramientas de automatización y orquestación de infraestructura para permitir operaciones escalables y fiables * Capacidad fluida para comunicarse en inglés (hablado y escrito) para interactuar directamente con clientes y colaborar con equipos multifuncionales **Deseable** * Experiencia con la gestión de paquetes Helm para desplegar y gestionar aplicaciones de Kubernetes * Familiaridad con soluciones de monitorización y observabilidad, especialmente Prometheus, Grafana y Loki, para el seguimiento de la salud y el rendimiento de la infraestructura * Experiencia práctica con herramientas de Infraestructura como Código (IaC), como Terraform, para el aprovisionamiento y la gestión automatizados de recursos en la nube * Exposición a entornos de Kubernetes multi-nube, incluidos Amazon EKS y Google GKE, para ampliar la experiencia en orquestación * Conocimientos de redes de Azure, incluida la configuración de VPN, la configuración de ExpressRoute y la gestión de seguridad de redes, para respaldar despliegues en la nube seguros y escalables * Familiaridad con herramientas de codificación asistida por IA (por ejemplo, GitHub Copilot, ChatGPT, Claude) para mejorar la productividad del desarrollo y la calidad del código * Experiencia en programación y optimización de recursos híbridos (nube y local) para respaldar entornos de cómputo flexibles y eficientes

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR

Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.