Categorías
···
Entrar / Registro
Ingeniero Senior de DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un ingeniero experimentado de DevOps/infraestructura para construir y mantener plataformas escalables de Kubernetes y Linux listas para GPU destinadas a equipos de inteligencia artificial e investigación, centrándonos en la automatización, la orquestación y el rendimiento. Aspectos destacados: 1. Construir plataformas escalables de Kubernetes y Linux listas para GPU para equipos de inteligencia artificial 2. Administrar Kubernetes y Volcano para una orquestación avanzada 3. Desarrollar automatización en Python y Shell para mejorar las operaciones Estamos construyendo plataformas escalables de Kubernetes y Linux listas para GPU para los equipos de inteligencia artificial e investigación de nuestros clientes, con automatización fiable y programación. Usted se encargará de la administración de Kubernetes, la orquestación basada en Volcano y la creación de scripts en Python y Shell, colaborando con ingenieros e investigadores para mejorar el rendimiento y la usabilidad; ¡postúlese ahora! **Responsabilidades** * Implementar, configurar y mantener clústeres de Kubernetes habilitados para GPU y entornos informáticos Linux independientes para maximizar la calidad de la programación y el rendimiento * Implementar y operar la programación de trabajos mediante Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas de espacio de nombres * Administrar Kubernetes de extremo a extremo, incluidos los espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Desarrollar y mantener automatizaciones en Python y Shell para simplificar la presentación de trabajos, el aprovisionamiento de recursos y la generación de informes del sistema * Colaborar con equipos de orquestación, optimización y observabilidad para incrementar la eficiencia de la programación, la utilización de la capacidad y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y la utilización de los recursos, proporcionando datos y análisis para necesidades de optimización e informes * Identificar y recomendar mejoras en la infraestructura, las herramientas y los flujos de trabajo de automatización para mejorar el rendimiento, la escalabilidad y la usabilidad * Garantizar que los procesos operativos ofrezcan una experiencia fluida y eficiente a los investigadores que ejecutan diversas cargas de trabajo de inteligencia artificial y computacionales **Requisitos** * Al menos 3 años de experiencia en ingeniería de DevOps o infraestructura en entornos complejos y de gran escala * Conocimientos expertos en administración y orquestación de Kubernetes, incluidos espacios de nombres, programación y distribución de POD, reclamaciones de volúmenes persistentes (PVC), sistemas de archivos de red (NFS) y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos en GPU, incluida la configuración de colas, la priorización de cargas de trabajo y la integración con Kubernetes * Experiencia comprobada gestionando entornos de clústeres GPU en Kubernetes y en nodos informáticos Linux independientes para cargas de trabajo de computación de alto rendimiento * Habilidades avanzadas de programación en Python para automatizar tareas de infraestructura, presentación de trabajos e informes del sistema * Competencia en programación de scripts UNIX Shell (por ejemplo, Bash) para automatizar sistemas y mejorar la eficiencia operativa * Sólidas habilidades de administración de sistemas Linux, incluida la resolución de problemas, la optimización del rendimiento y la gestión de la configuración para entornos informáticos * Comprensión sólida de los conceptos y herramientas de automatización y orquestación de infraestructura para operaciones escalables y fiables * Capacidad fluida para comunicarse en inglés (hablado y escrito) para interactuar directamente con los clientes y colaborar con equipos multifuncionales **Deseable** * Experiencia con la gestión de paquetes Helm para implementar y gestionar aplicaciones de Kubernetes * Familiaridad con soluciones de supervisión y observabilidad, especialmente Prometheus, Grafana y Loki, para el seguimiento de la salud y el rendimiento de la infraestructura * Experiencia práctica con herramientas de Infraestructura como Código (IaC), como Terraform, para el aprovisionamiento y la gestión automatizados de recursos en la nube * Exposición a entornos de Kubernetes multi-nube, incluidos Amazon EKS y Google GKE, para ampliar la experiencia en orquestación * Habilidades en redes de Azure, incluida la configuración de VPN, la instalación de ExpressRoute y la gestión de la seguridad de redes, para respaldar despliegues en la nube seguros y escalables * Familiaridad con herramientas de programación asistida por IA (por ejemplo, GitHub Copilot, ChatGPT, Claude) para mejorar la productividad del desarrollo y la calidad del código * Experiencia en programación y optimización de recursos híbridos (nube y locales) para respaldar entornos informáticos flexibles y eficientes

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.