Categorías
···
Entrar / Registro
Ingeniero Senior de DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un ingeniero de DevOps/infraestructura para gestionar operaciones de Kubernetes, ajustar nodos de cómputo Linux y desarrollar automatizaciones en Python y Bash para entornos de investigación en inteligencia artificial intensivos en GPU. Aspectos destacados: 1. Operar clústeres de Kubernetes con soporte para GPU para investigación en inteligencia artificial 2. Automatizar flujos de trabajo con scripts en Python y Shell 3. Ajustar los nodos de cómputo Linux para mejorar el rendimiento y la escalabilidad Estamos implementando una orquestación automatizada de Kubernetes y una infraestructura Linux que impulsa investigaciones en inteligencia artificial intensivas en GPU, utilizando Volcano para gestionar programaciones complejas. Usted se encargará de las operaciones de Kubernetes (espacios de nombres, RBAC, cuotas), del ajuste de los nodos de cómputo Linux y del desarrollo de automatizaciones en Python y Bash para mejorar la fiabilidad y la utilización de la capacidad; ¡postule ahora! **Responsabilidades** * Operar clústeres de Kubernetes con soporte para GPU y entornos independientes de cómputo Linux para garantizar una programación eficiente y un rendimiento constante * Configurar y gestionar la programación de trabajos mediante Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas por espacio de nombres * Mantener plataformas de Kubernetes de extremo a extremo, abarcando espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Automatizar flujos de trabajo recurrentes con scripts en Python y Shell para la presentación de trabajos, el aprovisionamiento de recursos y los informes del sistema * Coordinarse con los equipos de orquestación, optimización y observabilidad para perfeccionar la eficiencia de la programación, la utilización de recursos y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y la utilización de recursos, y proporcionar retroalimentación para requisitos de optimización e informes * Recomendar actualizaciones de la infraestructura, las herramientas y los flujos de trabajo de automatización para incrementar el rendimiento, la escalabilidad y la usabilidad * Mantener procesos operativos que permitan una experiencia fluida para los investigadores en cargas de trabajo de inteligencia artificial y computacionales **Requisitos** * Al menos 3 años de experiencia en puestos de ingeniería de DevOps o infraestructura que respalden entornos complejos y de gran escala * Competencia avanzada en administración y orquestación de Kubernetes, incluida la gestión de espacios de nombres, la programación y distribución de POD, las solicitudes de volúmenes persistentes (PVC), los sistemas de archivos en red (NFS) y la gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos en GPU, incluida la configuración de colas, la priorización de cargas de trabajo y su integración con Kubernetes * Experiencia comprobada en la gestión de entornos de clústeres con GPU, tanto dentro de Kubernetes como en nodos de cómputo Linux independientes, para soportar cargas de trabajo de computación de alto rendimiento * Habilidades avanzadas en scripting con Python para la automatización de tareas de infraestructura, la presentación de trabajos y la generación de informes del sistema * Competencia en scripting con UNIX Shell (por ejemplo, Bash) para la automatización del sistema y la eficiencia operativa * Conocimientos sólidos en administración de sistemas Linux, incluidos la resolución de problemas, el ajuste de rendimiento y la gestión de configuraciones para entornos de cómputo * Comprensión sólida de los conceptos y herramientas de automatización y orquestación de infraestructura para permitir operaciones escalables y fiables * Capacidad fluida para comunicarse en inglés (hablado y escrito) para interactuar directamente con clientes y colaborar con equipos multifuncionales **Deseable** * Experiencia con la gestión de paquetes Helm para la implementación y gestión de aplicaciones en Kubernetes * Conocimiento de soluciones de monitorización y observabilidad, especialmente Prometheus, Grafana y Loki, para el seguimiento de la salud y el rendimiento de la infraestructura * Experiencia práctica con herramientas de Infraestructura como Código (IaC), tales como Terraform, para el aprovisionamiento y gestión automatizados de recursos en la nube * Experiencia en entornos de Kubernetes multi-nube, incluidos Amazon EKS y Google GKE, para ampliar la experiencia en orquestación * Conocimientos de redes de Azure, incluida la configuración de VPN, la instalación de ExpressRoute y la gestión de seguridad de redes, para respaldar despliegues en la nube seguros y escalables * Familiaridad con herramientas de programación asistida por IA (por ejemplo, GitHub Copilot, ChatGPT, Claude) para mejorar la productividad del desarrollo y la calidad del código * Experiencia en programación y optimización de recursos híbridos (nube y locales) para respaldar entornos de cómputo flexibles y eficientes

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.