Ingeniero de Investigación en IA (Optimización del Kernel e Inferencia) – Teletrabajo al 100 % en todo el mundo

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Pje. Centenario 130, C1405 Ciudad Autónoma de Buenos Aires, Argentina

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Únete al equipo de modelos de IA de Tether para impulsar la innovación en arquitecturas de servicio e inferencia de modelos destinadas a sistemas avanzados de IA, optimizando su implementación para lograr un rendimiento escalable. Aspectos destacados: 1. Impulsando una revolución financiera global con soluciones innovadoras basadas en blockchain. 2. Innova con Tether en los ámbitos de stablecoins, energía, inteligencia artificial y educación. 3. Colabora con mentes brillantes en una potencia fintech global y remota. ***Únete a Tether y moldea el futuro de las finanzas digitales*** En Tether no solo desarrollamos productos, sino que lideramos una revolución financiera global. Nuestras soluciones innovadoras permiten a empresas —desde exchanges y billeteras hasta procesadores de pagos y cajeros automáticos— integrar sin esfuerzo tokens respaldados por reservas en múltiples blockchains. Al aprovechar el poder de la tecnología blockchain, Tether te permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo ello a una fracción del costo. La transparencia constituye la base de todo lo que hacemos, garantizando confianza en cada transacción. ***Innova con Tether*** **Finanzas Tether:** Nuestra innovadora suite de productos incluye la stablecoin más confiable del mundo, **USDT**, utilizada por cientos de millones de personas en todo el planeta, junto con servicios pioneros de tokenización de activos digitales. Pero eso es solo el comienzo: **Tether Power:** Impulsando un crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin mediante prácticas respetuosas con el medio ambiente en instalaciones de última generación y geográficamente diversas. **Tether Data:** Impulsando avances en inteligencia artificial y tecnologías peer-to-peer, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones innovadoras como **KEET**, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. **Tether Education:** Democratizando el acceso al aprendizaje digital de máxima calidad, empoderamos a las personas para prosperar en las economías digital y colaborativa, impulsando el crecimiento y las oportunidades globales. **Tether Evolution:** En la intersección entre la tecnología y el potencial humano, estamos ampliando los límites de lo posible, forjando un futuro en el que la innovación y las capacidades humanas se fusionan de formas poderosas e inéditas. ***¿Por qué unirte a nosotros?*** Nuestro equipo es una potencia global de talento, trabajando de forma remota desde todos los rincones del mundo. Si te apasiona dejar huella en el sector fintech, esta es tu oportunidad de colaborar con algunas de las mentes más brillantes, romper barreras y establecer nuevos estándares. Hemos crecido rápidamente, manteniéndonos ágiles y consolidando nuestro lugar como líderes del sector. Si cuentas con excelentes habilidades de comunicación en inglés y estás listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar indicado para ti. **¿Estás listo para formar parte del futuro?** **Acerca del puesto** Como miembro de nuestro equipo de modelos de IA, impulsarás la innovación en arquitecturas de servicio e inferencia de modelos destinadas a sistemas avanzados de IA. Tu trabajo se centrará en optimizar la implementación de modelos y las estrategias de inferencia para ofrecer un rendimiento altamente receptivo, eficiente y escalable en aplicaciones del mundo real. Trabajarás en un amplio espectro de sistemas, desde modelos eficientes en recursos diseñados para entornos con hardware limitado hasta arquitecturas complejas multimodales que integran datos como texto, imágenes y audio. Esperamos que poseas una experiencia profunda en el diseño y la optimización de pipelines de servicio de modelos y marcos de inferencia, así como una sólida formación en arquitecturas avanzadas de modelos. Adoptarás un enfoque práctico y basado en la investigación para desarrollar, probar e implementar nuevas estrategias de servicio e innovadores algoritmos de inferencia. Tus responsabilidades incluyen la ingeniería de pipelines de inferencia robustos, el establecimiento de métricas exhaustivas de rendimiento y la identificación y resolución de cuellos de botella en entornos productivos. El objetivo final es habilitar un rendimiento de IA de alto rendimiento, baja latencia, bajo consumo de memoria y escalable, que aporte valor tangible en escenarios dinámicos del mundo real. **Responsabilidades** * Diseñar e implementar arquitecturas de servicio de modelos de vanguardia que ofrezcan un alto rendimiento y baja latencia mientras optimizan el uso de memoria. Asegurar que estos pipelines funcionen eficientemente en diversos entornos, incluidos dispositivos con recursos limitados y plataformas periféricas (edge). Establecer objetivos claros de rendimiento, tales como reducción de la latencia, mejora de la respuesta por token y minimización de la huella de memoria. * Construir, ejecutar y supervisar pruebas controladas de inferencia tanto en entornos simulados como en entornos productivos reales. Seguimiento de indicadores clave de rendimiento, como la latencia de respuesta, el rendimiento, el consumo de memoria y las tasas de error, prestando especial atención a las métricas específicas para dispositivos con recursos limitados. Documentar los resultados iterativos y comparar los resultados con referencias establecidas para validar el rendimiento en distintas plataformas. * Identificar y preparar conjuntos de datos de prueba y escenarios de simulación de alta calidad adaptados a los desafíos reales de implementación, especialmente aquellos encontrados en dispositivos con bajos recursos. Establecer criterios medibles para garantizar que estos recursos evalúen efectivamente el rendimiento del modelo, la latencia y la utilización de memoria bajo diversas condiciones operativas. * Analizar la eficiencia computacional y diagnosticar cuellos de botella en el pipeline de servicio mediante el monitoreo de métricas tanto de procesamiento como de memoria. Abordar problemas como un procesamiento por lotes subóptimo, retrasos de red y un alto consumo de memoria para optimizar la infraestructura de servicio en términos de escalabilidad y fiabilidad en sistemas con recursos limitados. * Colaborar estrechamente con equipos multifuncionales para integrar marcos de servicio e inferencia optimizados en pipelines productivos diseñados para aplicaciones periféricas (edge) y en dispositivo. Definir métricas claras de éxito, tales como mejora del rendimiento en el mundo real, bajas tasas de error, escalabilidad robusta y uso óptimo de memoria, y asegurar un monitoreo continuo y refinamientos iterativos para lograr mejoras sostenidas. * Titulación universitaria en Ciencias de la Computación o campo relacionado. Preferiblemente doctorado en Procesamiento del Lenguaje Natural (PLN), Aprendizaje Automático o campo afín, complementado por un historial sólido en I+D en IA (con buenas publicaciones en conferencias de nivel A*). * Es indispensable tener conocimientos del Metal Shading Language (MSL). Deberás sentirte cómodo escribiendo shaders de cómputo personalizados desde cero. * Es esencial contar con experiencia comprobada en optimizaciones de bajo nivel a nivel de kernel y en la optimización de inferencia en dispositivos móviles. Tus contribuciones deben haber generado mejoras medibles en la latencia, el rendimiento y la huella de memoria de la inferencia para aplicaciones específicas del dominio, particularmente en dispositivos con recursos limitados y plataformas periféricas (edge). * Se requiere una comprensión profunda de las arquitecturas modernas de servicio de modelos y de las técnicas de optimización de inferencia. Esto incluye métodos de vanguardia para lograr un rendimiento de baja latencia y alto rendimiento, así como una gestión eficiente de la memoria en diversos escenarios de implementación con recursos limitados. * Es indispensable tener una sólida experiencia en la escritura de kernels GPU para dispositivos móviles (por ejemplo, smartphones), así como una comprensión profunda de los marcos y motores de servicio de modelos. Se requiere experiencia práctica en el desarrollo y la implementación de pipelines de inferencia de extremo a extremo, desde la optimización de modelos para un servicio eficiente hasta la integración de estas soluciones en dispositivos con recursos limitados. * Capacidad demostrada para aplicar investigación empírica para superar desafíos en el servicio de modelos, como la optimización de la latencia, los cuellos de botella computacionales y las restricciones de memoria. Deberás ser competente en el diseño de marcos de evaluación robustos y en la iteración de estrategias de optimización para seguir ampliando los límites del rendimiento de la inferencia y la eficiencia del sistema. * Sistemas distribuidos de inferencia: Diseño y optimización de motores de inferencia de alto rendimiento mediante técnicas como paralelismo tensorial, paralelismo en cadena (pipeline) y paralelismo por expertos, para gestionar modelos masivos en clústeres de GPU. * Comprensión profunda de las matemáticas y la estructura subyacentes a los modelos de difusión (Diffusion Models) y a los transformadores visuales (Vision Transformers) * Conocimiento de técnicas como poda (pruning), cuantización (quantization), Flash Attention, caché KV (KV Cache) y decodificación especulativa (Eagle), entre otras. **Información importante para los candidatos** Los fraudes relacionados con reclutamiento se han vuelto cada vez más frecuentes. Para protegerte, ten en cuenta lo siguiente al postularte a vacantes: * **Postúlate únicamente a través de nuestros canales oficiales.** No utilizamos plataformas ni agencias externas para reclutamiento, salvo que se indique expresamente. Todos los puestos disponibles figuran en nuestra página oficial de carreras: https://tether.recruitee.com/ * **Verifica la identidad del reclutador.** Todos nuestros reclutadores tienen perfiles verificados en LinkedIn. Si tienes dudas, puedes confirmar su identidad revisando su perfil o contactándonos a través de nuestro sitio web. * **Ten precaución con métodos inusuales de comunicación.** No realizamos entrevistas a través de WhatsApp, Telegram ni SMS. Toda la comunicación se lleva a cabo mediante correos electrónicos y plataformas oficiales de la empresa. * **Verifica cuidadosamente las direcciones de correo electrónico.** Toda comunicación proveniente de nosotros tendrá como dominio final **@**tether.to **o @**tether.io * **Nunca solicitaremos pagos ni datos financieros personales.** Si alguien te solicita información financiera personal o algún pago en cualquier etapa del proceso de contratación, se trata de una estafa. Por favor, repórtala inmediatamente. **Si tienes dudas, no dudes en contactarnos a través de nuestro sitio web oficial.**

Fuentea: indeed Ver publicación original

Sofía González

Indeed · HR

Compañía

Indeed

Sofía González

Indeed · HR

Empleos similares

Ingeniero de Investigación en IA (Optimización del Kernel e Inferencia) – Teletrabajo al 100 % en todo el mundo

Descripción

Compañía

Empleos similares

Administrativo de FTTH

Desarrollador Programador - Horario de oficina

Oficial de obra

ATENCIÓN AL CLIENTE

Socio de Marketing de Rendimiento (Trabajo Remoto)

Empleada Administrativa