Ingeniero de Investigación en IA (Optimización de Kernel e Inferencia) - 100 % remoto en todo el mundo

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Pje. Centenario 130, C1405 Ciudad Autónoma de Buenos Aires, Argentina

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Únase al equipo de modelos de IA de Tether para impulsar la innovación en arquitecturas de servicio e inferencia de modelos destinadas a sistemas avanzados de IA, optimizando su despliegue para lograr un rendimiento altamente receptivo y escalable. Aspectos destacados: 1. Impulsando una revolución financiera global con soluciones avanzadas basadas en blockchain 2. Innovar con la diversa gama de productos de Tether, desde finanzas hasta inteligencia artificial y educación 3. Colaborar con mentes brillantes en una potencia global de talento remoto ***Únase a Tether y moldeé el futuro de las finanzas digitales*** En Tether, no solo construimos productos: lideramos una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas —desde exchanges y billeteras hasta procesadores de pagos y cajeros automáticos— integrar sin problemas tokens respaldados por reservas en múltiples blockchains. Al aprovechar el poder de la tecnología blockchain, Tether le permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo ello a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando confianza en cada transacción. ***Innovar con Tether*** **Finanzas de Tether:** Nuestra innovadora gama de productos incluye la stablecoin más confiable del mundo, **USDT**, utilizada por cientos de millones de personas en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. Pero eso es solo el comienzo: **Tether Power:** Impulsando un crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin mediante prácticas ecológicas en instalaciones de última generación y geográficamente diversas. **Tether Data:** Impulsando avances en inteligencia artificial y tecnologías peer-to-peer, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como **KEET**, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. **Tether Education:** Democratizando el acceso al aprendizaje digital de primer nivel, empoderamos a las personas para prosperar en las economías digital y de trabajos temporales, impulsando el crecimiento y las oportunidades globales. **Tether Evolution:** En la intersección entre la tecnología y el potencial humano, estamos expandiendo los límites de lo posible, forjando un futuro en el que la innovación y las capacidades humanas se fusionan de maneras poderosas y sin precedentes. ***¿Por qué unirse a nosotros?*** Nuestro equipo es una potencia global de talento que trabaja de forma remota desde todos los rincones del planeta. Si le apasiona dejar huella en el sector fintech, esta es su oportunidad de colaborar con algunas de las mentes más brillantes, rompiendo barreras y estableciendo nuevos estándares. Hemos crecido rápidamente, manteniéndonos ágiles y consolidando nuestro lugar como líderes en la industria. Si posee excelentes habilidades de comunicación en inglés y está listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar indicado para usted. **¿Está listo para formar parte del futuro?** **Acerca del puesto** Como miembro de nuestro equipo de modelos de IA, usted impulsará la innovación en arquitecturas de servicio e inferencia de modelos destinadas a sistemas avanzados de IA. Su trabajo se centrará en optimizar las estrategias de despliegue e inferencia de modelos para ofrecer un rendimiento altamente receptivo, eficiente y escalable en aplicaciones reales. Trabajará en un amplio espectro de sistemas, desde modelos eficientes en recursos diseñados para entornos con hardware limitado hasta arquitecturas complejas multimodales que integran datos como texto, imágenes y audio. Esperamos que tenga una profunda experiencia en el diseño y la optimización de tuberías de servicio de modelos y marcos de inferencia, así como una sólida formación en arquitecturas avanzadas de modelos. Adoptará un enfoque práctico y basado en la investigación para desarrollar, probar e implementar nuevas estrategias de servicio e innovadores algoritmos de inferencia. Sus responsabilidades incluyen la ingeniería de tuberías robustas de inferencia, el establecimiento de métricas exhaustivas de rendimiento y la identificación y resolución de cuellos de botella en entornos productivos. El objetivo final es habilitar un rendimiento de IA de alto rendimiento, baja latencia, bajo consumo de memoria y escalable, que aporte valor tangible en escenarios dinámicos del mundo real. **Responsabilidades** * Diseñar e implementar arquitecturas de servicio de modelos de vanguardia que ofrezcan un alto rendimiento y baja latencia mientras optimizan el uso de memoria. Asegurarse de que estas tuberías funcionen eficientemente en diversos entornos, incluidos dispositivos con recursos limitados y plataformas perimetrales (edge). Establecer objetivos claros de rendimiento, tales como reducción de la latencia, mejora de la respuesta por token y minimización de la huella de memoria. * Construir, ejecutar y supervisar pruebas controladas de inferencia tanto en entornos simulados como en entornos productivos reales. Seguir indicadores clave de rendimiento como la latencia de respuesta, el rendimiento (throughput), el consumo de memoria y las tasas de error, prestando especial atención a las métricas específicas para dispositivos con recursos limitados. Documentar los resultados iterativos y comparar los resultados con referencias establecidas para validar el rendimiento en distintas plataformas. * Identificar y preparar conjuntos de datos de prueba y escenarios de simulación de alta calidad adaptados a los desafíos reales de despliegue, especialmente aquellos encontrados en dispositivos con bajos recursos. Establecer criterios medibles para asegurar que estos recursos evalúen eficazmente el rendimiento del modelo, la latencia y la utilización de memoria bajo diversas condiciones operativas. * Analizar la eficiencia computacional y diagnosticar cuellos de botella en la tubería de servicio mediante el monitoreo tanto de las métricas de procesamiento como de memoria. Abordar problemas como el procesamiento por lotes subóptimo, los retrasos de red y el alto consumo de memoria para optimizar la infraestructura de servicio en términos de escalabilidad y fiabilidad en sistemas con recursos limitados. * Trabajar estrechamente con equipos multifuncionales para integrar marcos de servicio e inferencia optimizados en tuberías productivas diseñadas para aplicaciones perimetrales (edge) y en dispositivo. Definir métricas claras de éxito, tales como mejora del rendimiento en el mundo real, bajas tasas de error, escalabilidad robusta, uso óptimo de memoria y garantizar un monitoreo continuo y refinamientos iterativos para lograr mejoras sostenidas. * Título universitario en Ciencias de la Computación o campo relacionado. Idealmente, doctorado en Procesamiento del Lenguaje Natural (NLP), Aprendizaje Automático o campo afín, complementado con un historial sólido en I+D en IA (con buenas publicaciones en conferencias de categoría A*). * Debe tener conocimientos del Metal Shading Language (MSL). Debe sentirse cómodo escribiendo shaders de cómputo personalizados desde cero. * Es esencial contar con experiencia comprobada en optimizaciones de bajo nivel de kernels y en optimización de inferencia en dispositivos móviles. Sus contribuciones deben haber generado mejoras cuantificables en la latencia, el rendimiento (throughput) y la huella de memoria de la inferencia para aplicaciones específicas del dominio, particularmente en dispositivos con recursos limitados y plataformas perimetrales (edge). * Se requiere una comprensión profunda de las arquitecturas modernas de servicio de modelos y técnicas de optimización de inferencia. Esto incluye métodos de vanguardia para lograr un rendimiento de baja latencia y alto rendimiento (throughput), así como una gestión eficiente de la memoria en diversos escenarios de despliegue con recursos limitados. * Debe poseer una sólida experiencia en la escritura de kernels para GPU en dispositivos móviles (es decir, smartphones), así como una profunda comprensión de los marcos y motores de servicio de modelos. Se requiere experiencia práctica en el desarrollo y despliegue de tuberías de inferencia de extremo a extremo, desde la optimización de modelos para un servicio eficiente hasta la integración de estas soluciones en dispositivos con recursos limitados. * Capacidad demostrada para aplicar investigación empírica para superar desafíos en el servicio de modelos, tales como la optimización de la latencia, los cuellos de botella computacionales y las restricciones de memoria. Debe ser competente en el diseño de marcos de evaluación robustos y en la iteración de estrategias de optimización para seguir expandiendo los límites del rendimiento de la inferencia y la eficiencia del sistema. * Sistemas distribuidos de inferencia: Diseño y optimización de motores de inferencia de alto rendimiento mediante técnicas como paralelismo de tensores, paralelismo de tuberías y paralelismo de expertos, para gestionar modelos masivos en clústeres de GPU. * Comprensión profunda de las matemáticas y la estructura subyacentes a los modelos de difusión (Diffusion Models) y a los transformadores visuales (Vision Transformers) * Conocimiento de poda (Pruning), cuantización (Quantization), Flash Attention, caché KV (KV Cache), decodificación especulativa (Eagle), etc. **Información importante para los candidatos** Los fraudes en reclutamiento se han vuelto cada vez más comunes. Para protegerse, tenga en cuenta lo siguiente al postularse a vacantes: * **Postúlese únicamente a través de nuestros canales oficiales.** No utilizamos plataformas ni agencias externas para reclutamiento, salvo que se indique expresamente. Todos los puestos disponibles figuran en nuestra página oficial de carreras: https://tether.recruitee.com/ * **Verifique la identidad del reclutador.** Todos nuestros reclutadores cuentan con perfiles verificados en LinkedIn. Si tiene dudas, puede confirmar su identidad revisando su perfil o contactándonos a través de nuestro sitio web. * **Sea cauteloso con métodos inusuales de comunicación.** No realizamos entrevistas a través de WhatsApp, Telegram o SMS. Toda la comunicación se lleva a cabo mediante correos electrónicos y plataformas oficiales de la empresa. * **Verifique cuidadosamente las direcciones de correo electrónico.** Toda comunicación proveniente de nosotros provendrá de correos electrónicos que terminen en **@**tether.to **o @**tether.io * **Nunca solicitaremos pagos ni detalles financieros personales.** Si alguien le solicita información financiera personal o un pago en cualquier etapa del proceso de contratación, se trata de una estafa. Por favor, repórtela inmediatamente. **Si tiene dudas, no dude en contactarnos a través de nuestro sitio web oficial.**

Fuentea: indeed Ver publicación original

Sofía González

Indeed · HR

Compañía

Indeed

Sofía González

Indeed · HR

Empleos similares

Ingeniero de Investigación en IA (Optimización de Kernel e Inferencia) - 100 % remoto en todo el mundo

Descripción

Compañía

Empleos similares

Socio de Marketing de Rendimiento (Trabajo Remoto)

Trainer

Ejecutivo Comercial

Asistente de finanzas JUNIOR

Gerente de equipo

Mecánico de grúas y autoelevadores.