Categorías
···
Entrar / Registro
Ingeniero Senior de DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Como Ingeniero Senior de DevOps, construirá y operará plataformas escalables de Kubernetes listas para GPU para cargas de trabajo de inteligencia artificial e investigación, centrándose en la orquestación fiable, el rendimiento y la automatización. Aspectos destacados: 1. Construir plataformas escalables de Kubernetes listas para GPU para cargas de trabajo de inteligencia artificial e investigación 2. Administrar Kubernetes de extremo a extremo e implementar la programación de trabajos Volcano 3. Automatizar flujos de trabajo con Python y scripting de shell UNIX en un entorno orientado al cliente Estamos construyendo plataformas escalables de Kubernetes listas para GPU para cargas de trabajo de inteligencia artificial e investigación, centrándonos en la orquestación fiable y el rendimiento. Como Ingeniero Senior de DevOps, operará entornos de cómputo Kubernetes y Linux, ejecutará la programación Volcano y automatizará flujos de trabajo con Python y scripting de shell UNIX en una configuración de entrega orientada al cliente. ¡Postúlese ahora para ayudarnos a ofrecer computación eficiente a escala! **Responsabilidades** * Implementar, configurar y mantener clústeres de Kubernetes habilitados para GPU y entornos independientes de cómputo Linux para maximizar la eficiencia y el rendimiento de la programación * Implementar y operar la programación de trabajos Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas de espacio de nombres * Administrar Kubernetes de extremo a extremo, cubriendo espacios de nombres, RBAC, cuotas de recursos y enfoques de aislamiento de cargas de trabajo * Crear y mantener automatizaciones en Python y Shell para simplificar la presentación de trabajos, el aprovisionamiento de recursos y la generación de informes del sistema * Colaborar con equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, la utilización de capacidad y los flujos de trabajo de los investigadores * Supervisar la salud de la plataforma y la utilización de recursos, compartiendo datos y comentarios para apoyar las necesidades de optimización e informes * Recomendar e impulsar mejoras en la infraestructura, las herramientas y los flujos de trabajo de automatización para mejorar el rendimiento, la escalabilidad y la usabilidad * Garantizar que las operaciones ofrezcan una experiencia fluida y eficiente a los investigadores en diversas cargas de trabajo de inteligencia artificial y computacionales **Requisitos** * Mínimo 3 años de experiencia en puestos de DevOps o ingeniería de infraestructura en entornos complejos y de gran escala * Conocimientos expertos en administración de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos GPU, configuración de colas, priorización de cargas de trabajo e integración con Kubernetes * Experiencia demostrable en la ejecución de entornos de clústeres GPU en Kubernetes y en nodos independientes de cómputo Linux * Habilidades avanzadas de scripting en Python para automatización de infraestructura, además de competencia en scripting de shell UNIX (por ejemplo, Bash) * Capacidad sólida de administración de sistemas Linux, incluidas la resolución de problemas, la optimización del rendimiento y la gestión de configuraciones * Comprensión sólida de los conceptos de automatización y orquestación de infraestructura y de las herramientas de soporte correspondientes * Competencia fluida en inglés (hablado y escrito) para interacción directa con clientes **Deseable** * Helm para empaquetado y lanzamiento de aplicaciones en Kubernetes * Herramientas de monitorización y observabilidad, especialmente Prometheus, Grafana y Loki * Herramientas de Infraestructura como Código, como Terraform * Experiencia con Kubernetes multi-nube (Amazon EKS, Google GKE) * Conocimientos de redes de Azure, incluidas VPN, ExpressRoute y seguridad de red * Familiaridad con herramientas de codificación asistida por IA (por ejemplo, GitHub Copilot, ChatGPT, Claude) * Experiencia en programación y optimización de recursos híbridos (nube + local)

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.