Categorías
···
Entrar / Registro
Ingeniero Senior de DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Este puesto implica apoyar iniciativas de IA mediante la gestión de infraestructura informática basada en Kubernetes y Linux con soporte para GPU, la automatización de flujos de trabajo y la optimización de la programación para investigadores. Aspectos destacados: 1. Apoyar iniciativas de IA de vanguardia con infraestructura avanzada 2. Automatizar sistemas complejos mediante scripting en Python y Shell 3. Optimizar la eficiencia de la programación y los flujos de trabajo de los investigadores Estamos apoyando la entrega al cliente ejecutando infraestructura informática basada en Kubernetes y Linux con soporte para GPU, optimizada para iniciativas de IA y programación impulsada por Volcano. Implementará automatizaciones en Python y UNIX Shell, administrará recursos de Kubernetes como PVC, NFS y cuotas, y colaborará con investigadores para agilizar sus flujos de trabajo; ¡postúlese ahora! **Responsabilidades** * Configurar y mantener clústeres de Kubernetes con soporte para GPU, junto con entornos informáticos Linux independientes, garantizando una programación estable y un alto rendimiento * Gestionar flujos de trabajo de programación con Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas por espacio de nombres * Controlar la administración de Kubernetes a través de espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Desarrollar y dar soporte a scripts en Python y Shell que automatizan el envío de trabajos, el aprovisionamiento de recursos y los informes del sistema * Colaborar con equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, la utilización de recursos y los flujos de trabajo de los investigadores * Evaluar la salud de la infraestructura y la utilización de recursos, y aportar datos para requisitos de optimización e informes * Proponer recomendaciones para mejorar la infraestructura, las herramientas y los flujos de trabajo de automatización con el fin de potenciar el rendimiento, la escalabilidad y la usabilidad * Apoyar los procesos operativos que garanticen experiencias fluidas para los investigadores en cargas de trabajo de IA y computacionales **Requisitos** * Al menos 3 años de experiencia en puestos de DevOps o ingeniería de infraestructura que respalden entornos complejos y de gran escala * Competencia experta en administración y orquestación de Kubernetes, incluida la gestión de espacios de nombres, programación y distribución de POD, reclamaciones de volúmenes persistentes (PVC), sistemas de archivos de red (NFS) y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos con GPU, incluida la configuración de colas, la priorización de cargas de trabajo y la integración con Kubernetes * Experiencia comprobada gestionando entornos de clústeres con GPU, tanto dentro de Kubernetes como en nodos informáticos Linux independientes, para soportar cargas de trabajo de computación de alto rendimiento * Habilidades avanzadas de scripting en Python para automatizar tareas de infraestructura, envío de trabajos e informes del sistema * Competencia en scripting UNIX Shell (por ejemplo, Bash) para la automatización del sistema y la eficiencia operativa * Sólidas habilidades de administración de sistemas Linux, incluidas la solución de problemas, la optimización del rendimiento y la gestión de configuraciones para entornos informáticos * Conocimientos sólidos sobre conceptos y herramientas de automatización y orquestación de infraestructura para permitir operaciones escalables y fiables * Dominio fluido del inglés (hablado y escrito) para interactuar directamente con clientes y colaborar con equipos multifuncionales **Deseable** * Experiencia con la gestión de paquetes Helm para implementar y gestionar aplicaciones de Kubernetes * Familiaridad con soluciones de monitorización y observabilidad, especialmente Prometheus, Grafana y Loki, para el seguimiento de la salud y el rendimiento de la infraestructura * Experiencia práctica con herramientas de Infraestructura como Código (IaC), tales como Terraform, para el aprovisionamiento y la gestión automatizados de recursos en la nube * Experiencia en entornos de Kubernetes multi-nube, incluidos Amazon EKS y Google GKE, para ampliar la experiencia en orquestación * Habilidades en redes de Azure, incluida la configuración de VPN, la instalación de ExpressRoute y la gestión de seguridad de redes, para respaldar despliegues en la nube seguros y escalables * Familiaridad con herramientas de codificación asistida por IA (por ejemplo, GitHub Copilot, ChatGPT, Claude) para mejorar la productividad del desarrollo y la calidad del código * Experiencia en programación y optimización de recursos híbridos (nube y locales) para respaldar entornos informáticos flexibles y eficientes

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.