




Resumen: Buscamos un Ingeniero Jefe de GenAI para diseñar, mejorar y escalar productos de IA impulsados por modelos de lenguaje de gran tamaño (LLM), centrándonos en servicios de backend, despliegue en la nube e integraciones de API. Aspectos destacados: 1. Diseñar y mejorar continuamente productos de IA impulsados por modelos de lenguaje de gran tamaño (LLM) 2. Dirigir servicios de backend escalables e implementaciones en la nube (preferiblemente Azure) 3. Colaborar con los equipos de IA/DS y DevOps para perfeccionar flujos de trabajo y reforzar la confiabilidad Estamos buscando un **Ingeniero Jefe de GenAI** para liderar el diseño y la mejora continua de productos de IA impulsados por modelos de lenguaje de gran tamaño (LLM). Usted dirigirá servicios de backend escalables, implementaciones en la nube (preferiblemente Azure) e integraciones de API de LLM, colaborando estrechamente con los equipos de IA/DS y DevOps. ¡Postúlese ahora para ayudarnos a entregar sistemas de GenAI fiables y eficientes desde el punto de vista de costos! **Responsabilidades** * Diseñar y mejorar servicios de backend que escalen para aplicaciones impulsadas por IA/LLM * Integrar y operar aplicaciones basadas en LLM en entornos en la nube, con preferencia por Azure * Implementar canalizaciones de CI/CD que simplifiquen y automatizen los despliegues * Optimizar el rendimiento, la eficiencia de costos y la confiabilidad de los servicios en cargas de trabajo de IA * Establecer observabilidad y registro para supervisar el rendimiento de las API de LLM * Colaborar con los equipos de IA/DS y DevOps para perfeccionar flujos de trabajo y reforzar la confiabilidad del sistema * Desarrollar API y microservicios que habiliten funcionalidades de productos impulsados por IA * Resolver problemas relacionados con la latencia, el control de costos, los reintetos y los mecanismos de respaldo para aplicaciones respaldadas por LLM * Arquitecturar componentes de backend utilizando bases de datos SQL/NoSQL, Redis y Kafka * Aprovechar Databricks y el Protocolo de Contexto de Modelo (MCP) para mejorar y ampliar los flujos de trabajo de IA **Requisitos** * Amplia experiencia en ingeniería de backend con Python y FastAPI, incluyendo 7\+ años en entornos productivos * Capacidad comprobada para construir y operar aplicaciones de GenAI centradas en modelos de lenguaje de gran tamaño (LLM) * Conocimientos profundos sobre ingeniería de indicaciones (prompt engineering), flujos de trabajo basados en agentes y patrones de orquestación * Experiencia práctica en la integración de API de LLM y la aplicación de mejores prácticas operativas * Sólida experiencia en el diseño de arquitecturas de backend escalables para API impulsadas por LLM * Conocimientos prácticos de bases de datos SQL/NoSQL, además de Redis y Kafka en sistemas reales * Experiencia práctica con Databricks y MCP (Protocolo de Contexto de Modelo) en flujos de trabajo de IA * Excelentes habilidades de comunicación en inglés, al nivel B2\+ (intermedio alto) **Deseable** * Experticia avanzada en flujos de trabajo basados en agentes * Familiaridad con Databricks y el Protocolo de Contexto de Modelo


