Ingeniero de Investigación en IA (Aprendizaje por Refuerzo Multimodal) - 100 % remoto a nivel mundial

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Pje. Centenario 130, C1405 Ciudad Autónoma de Buenos Aires, Argentina

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Únase al equipo de modelos de IA de Tether para impulsar la innovación en el aprendizaje por refuerzo multimodal, optimizando la toma de decisiones y el comportamiento adaptativo a través de modalidades integradas de datos para sistemas inteligentes de próxima generación. Aspectos destacados: 1. Diseñe el futuro de las finanzas digitales con soluciones pioneras basadas en blockchain. 2. Innovación mediante inteligencia artificial de vanguardia y tecnología peer-to-peer. 3. Colabore con las mentes más brillantes de una potencia global de talento remoto. ***Únase a Tether y diseña el futuro de las finanzas digitales*** En Tether, no solo construimos productos: lideramos una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas —desde exchanges y billeteras hasta procesadores de pagos y cajeros automáticos— integrar sin problemas tokens respaldados por reservas en múltiples blockchains. Al aprovechar el poder de la tecnología blockchain, Tether le permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo ello a una fracción del costo. La transparencia es la piedra angular de todo lo que hacemos, garantizando confianza en cada transacción. ***Innovación con Tether*** **Finanzas Tether:** Nuestra innovadora suite de productos incluye la moneda estable más confiable del mundo, **USDT**, utilizada por cientos de millones de personas en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. Pero eso es solo el comienzo: **Tether Power:** Impulsando un crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin mediante prácticas ecológicas en instalaciones de última generación y geográficamente diversas. **Tether Data:** Impulsando avances en inteligencia artificial y tecnología peer-to-peer, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como **KEET**, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. **Tether Education:** Democratizando el acceso al aprendizaje digital de primer nivel, empoderamos a las personas para prosperar en las economías digital y gig, impulsando el crecimiento y las oportunidades globales. **Tether Evolution:** En la intersección entre tecnología y potencial humano, estamos expandiendo los límites de lo posible, diseñando un futuro donde la innovación y las capacidades humanas se fusionan de formas poderosas e inéditas. ***¿Por qué unirse a nosotros?*** Nuestro equipo es una potencia global de talento que trabaja de forma remota desde todos los rincones del mundo. Si está apasionado por dejar su huella en el sector fintech, esta es su oportunidad para colaborar con algunas de las mentes más brillantes, romper barreras y establecer nuevos estándares. Hemos crecido rápidamente, manteniéndonos ágiles y consolidando nuestro lugar como líderes en la industria. Si posee excelentes habilidades de comunicación en inglés y está listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar indicado para usted. **¿Está listo para formar parte del futuro?** **Acerca del puesto** Como miembro del equipo de modelos de IA, usted impulsará la innovación en el aprendizaje por refuerzo multimodal para avanzar los sistemas inteligentes de próxima generación. Su trabajo se centrará en optimizar la toma de decisiones y el comportamiento adaptativo a través de modalidades integradas de datos —como texto, imágenes y audio— para ofrecer una inteligencia mejorada, un rendimiento robusto y capacidades específicas del dominio ante desafíos del mundo real. Desarrollará y escalará técnicas de aprendizaje por refuerzo dentro de arquitecturas multimodales complejas, incluidos modelos generativos basados en difusión y modelos autorregresivos para la comprensión multimodal, así como modelos eficientes en recursos diseñados para entornos de hardware restringidos. Esto incluye investigar algoritmos de aprendizaje por refuerzo para modelos multimodales, abarcando modelos de difusión para imágenes, modelos autorregresivos para razonamiento multimodal y marcos multimodales unificados. Se espera que tenga una profunda experiencia en el diseño de sistemas de aprendizaje por refuerzo multimodal y una sólida formación en arquitecturas avanzadas de modelos, con un enfoque práctico y orientado a la investigación para construir e implementar nuevos algoritmos y marcos de entrenamiento. Diseñará y desarrollará infraestructura de RL y estrategias de modelado de recompensas para permitir un entrenamiento a gran escala eficiente, mejorar la estabilidad del entrenamiento y mitigar la manipulación de recompensas y modos de fallo relacionados. Sus responsabilidades también incluyen curar entornos de simulación multimodales y conjuntos de datos de entrenamiento, mejorar el rendimiento de las políticas base a través de distintas modalidades e identificar y resolver cuellos de botella en el aprendizaje multimodal y la optimización de recompensas. Además, explorará paradigmas de aprendizaje por refuerzo de próxima generación que aprendan de forma más directa y efectiva a partir de la retroalimentación del entorno, con el objetivo de desbloquear un rendimiento superior de IA adaptado al dominio en entornos dinámicos del mundo real. **Responsabilidades** * Realizar investigación sobre algoritmos de aprendizaje por refuerzo para modelos multimodales, incluidos enfoques basados en difusión para imágenes, modelos autorregresivos para comprensión multimodal y marcos unificados que integren múltiples modalidades. * Diseñar y construir infraestructura de aprendizaje por refuerzo que soporte entrenamiento escalable y distribuido en sistemas multimodales, manteniendo eficiencia y fiabilidad. * Desarrollar y perfeccionar estrategias de modelado de recompensas que mejoren la estabilidad del entrenamiento, alineen el comportamiento del modelo con los resultados deseados y mitiguén la manipulación de recompensas y modos de fallo relacionados. * Crear y curar entornos de simulación multimodales y conjuntos de datos para respaldar un entrenamiento, evaluación y comparación rigurosos de los sistemas de aprendizaje por refuerzo. * Diseñar y aplicar protocolos rigurosos de comparación y evaluación para medir el rendimiento del modelo, seguir el progreso frente a líneas base y validar mejoras en tareas multimodales. * Analizar y optimizar el rendimiento de las políticas a través de distintas modalidades identificando cuellos de botella en el entrenamiento, la asignación de crédito y la alineación cruzada entre modalidades. * Investigar y desarrollar paradigmas de aprendizaje por refuerzo de próxima generación que aprendan de forma más efectiva a partir de la retroalimentación del entorno, con el objetivo de lograr un rendimiento puntero (SOTA) superior. * Publicar hallazgos de investigación en conferencias de primer nivel como ICML, NeurIPS, ICLR, CVPR, ICCV, ECCV, etc. * Se requiere una maestría en Ciencias de la Computación o campo afín; se prefiere un doctorado en Aprendizaje Automático, Procesamiento del Lenguaje Natural (PLN), Visión por Computadora o disciplina estrechamente relacionada, junto con un sólido historial de investigación e publicaciones en conferencias de primer nivel. * Experiencia demostrada ejecutando experimentos de aprendizaje por refuerzo a gran escala en sistemas multimodales y centrados en visión, incluidos entornos de RL en línea, con impacto demostrado en la toma de decisiones específica del dominio y mejoras medibles en el rendimiento de las políticas. * Comprensión profunda de los algoritmos y métodos de optimización de aprendizaje por refuerzo aplicados a problemas de visión y aprendizaje multimodal, con énfasis en la mejora de la estabilidad de las políticas, la exploración y la eficiencia muestral en entornos complejos y de alta dimensionalidad que involucran imágenes, video y otras modalidades. * Alta competencia en PyTorch y frameworks de aprendizaje profundo para IA visual y multimodal, con experiencia práctica en la construcción de pipelines de RL de extremo a extremo que cubran simulación, entrenamiento, evaluación e implementación en sistemas de producción. * Capacidad demostrada para aplicar investigación empírica a la resolución de desafíos fundamentales de RL en tareas multimodales y visuales, tales como la ineficiencia muestral, los compromisos entre exploración y explotación y la inestabilidad del entrenamiento, junto con experiencia en el diseño de marcos de evaluación robustos y la iteración sobre mejoras algorítmicas para avanzar el rendimiento del agente. * Historial comprobado de publicaciones de investigación en conferencias de primer nivel como ICML, NeurIPS, ICLR, CVPR, ICCV, ECCV, etc. **Información importante para los candidatos** Los fraudes de reclutamiento se han vuelto cada vez más comunes. Para protegerse, tenga en cuenta lo siguiente al postularse a puestos: * **Postúlese únicamente a través de nuestros canales oficiales.** No utilizamos plataformas ni agencias externas para reclutamiento, salvo que se indique expresamente. Todos los puestos disponibles están listados en nuestra página oficial de carreras: https://tether.recruitee.com/ * **Verifique la identidad del reclutador.** Todos nuestros reclutadores cuentan con perfiles verificados en LinkedIn. Si tiene dudas, puede confirmar su identidad revisando su perfil o contactándonos a través de nuestro sitio web. * **Sea cauteloso con métodos inusuales de comunicación.** No realizamos entrevistas a través de WhatsApp, Telegram ni SMS. Toda la comunicación se lleva a cabo mediante correos electrónicos y plataformas oficiales de la empresa. * **Verifique cuidadosamente las direcciones de correo electrónico.** Toda comunicación proveniente de nosotros tendrá como dominio final **@**tether.to **o @**tether.io * **Nunca solicitaremos pagos ni datos financieros personales.** Si alguien le solicita información financiera personal o un pago en cualquier etapa del proceso de contratación, se trata de una estafa. Por favor, repórtela de inmediato. **Si tiene dudas, no dude en contactarnos a través de nuestro sitio web oficial.**

Fuentea: indeed Ver publicación original

Sofía González

Indeed · HR

Compañía

Indeed

Sofía González

Indeed · HR

Empleos similares

Ingeniero de Investigación en IA (Aprendizaje por Refuerzo Multimodal) - 100 % remoto a nivel mundial

Descripción

Compañía

Empleos similares

Socio de Marketing de Rendimiento (Trabajo Remoto)

Trainer

Analista de compras

Gerente de equipo

Ejecutivo Comercial

Presentador de Juego - Moreno (Turnos Rotativos)