




***Únete a Tether y da forma al futuro de las finanzas digitales*** En Tether, no solo creamos productos, estamos liderando una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas—desde exchanges y billeteras hasta procesadores de pagos y cajeros automáticos—integrar sin problemas tokens respaldados por reservas a través de blockchains. Al aprovechar el poder de la tecnología blockchain, Tether te permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando confianza en cada transacción. ***Innova con Tether*** **Tether Finance:** Nuestra suite de productos innovadores incluye el stablecoin más confiable del mundo, **USDT**, utilizado por cientos de millones de personas en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. Pero eso es solo el comienzo: **Tether Power:** Impulsando un crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para minería de Bitcoin utilizando prácticas ecológicas en instalaciones modernas y geográficamente diversas. **Tether Data:** Impulsando avances en IA y tecnologías punto a punto, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como **KEET**, nuestra aplicación principal que redefine el intercambio seguro y privado de datos. **Tether Education**: Democratizando el acceso al aprendizaje digital de alto nivel, capacitamos a las personas para prosperar en las economías digital y gig, impulsando el crecimiento y las oportunidades globales. **Tether Evolution**: En la intersección entre tecnología y el potencial humano, estamos ampliando los límites de lo posible, creando un futuro donde la innovación y las capacidades humanas se fusionen de formas poderosas y sin precedentes. ***¿Por qué unirte a nosotros?*** Nuestro equipo es un centro de talento global, trabajando de forma remota desde todos los rincones del mundo. Si te apasiona dejar huella en el sector fintech, esta es tu oportunidad de colaborar con algunas de las mentes más brillantes, rompiendo barreras y estableciendo nuevos estándares. Hemos crecido rápidamente, manteniéndonos ágiles y asegurando nuestro lugar como líderes en la industria. Si tienes excelentes habilidades de comunicación en inglés y estás listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar ideal para ti. **¿Estás listo para ser parte del futuro?** **Acerca del puesto** Como miembro del equipo de modelos de IA, impulsarás la innovación en enfoques de aprendizaje por refuerzo para modelos avanzados. Tu trabajo optimizará la toma de decisiones y el comportamiento adaptativo para ofrecer mayor inteligencia, mejor rendimiento y capacidades específicas del dominio frente a desafíos del mundo real. Trabajarás en un amplio espectro de sistemas, incluyendo modelos eficientes en el uso de recursos diseñados para entornos con hardware limitado y arquitecturas multimodales complejas que integran datos como texto, imágenes y audio. Esperamos que tengas una experiencia profunda en el diseño de sistemas de aprendizaje por refuerzo y una sólida formación en arquitecturas avanzadas de modelos. Adoptarás un enfoque práctico y basado en investigación para desarrollar, probar e implementar nuevos algoritmos de aprendizaje por refuerzo y marcos de entrenamiento. Tus responsabilidades incluirán curar entornos de simulación especializados y conjuntos de datos de entrenamiento, mejorar el rendimiento de políticas básicas y detectar así como resolver cuellos de botella en el proceso de aprendizaje por refuerzo. El objetivo final es desbloquear un rendimiento superior de la IA adaptado al dominio y expandir los límites de lo que estos modelos pueden lograr en entornos dinámicos del mundo real. **Responsabilidades** * Desarrollar e implementar algoritmos de vanguardia de aprendizaje por refuerzo diseñados para optimizar los procesos de toma de decisiones tanto en entornos simulados como del mundo real. Establecer objetivos claros de rendimiento, como maximización de recompensas y estabilidad de políticas. * Crear, ejecutar y monitorear experimentos controlados de aprendizaje por refuerzo. Seguir indicadores clave de rendimiento mientras documentas resultados iterativos y comparas resultados con puntos de referencia establecidos. * Identificar y seleccionar entornos de simulación y conjuntos de datos de alta calidad adaptados a desafíos específicos del dominio. Establecer criterios medibles para garantizar que la selección y preparación de estos recursos mejore significativamente el proceso de aprendizaje y el rendimiento general del modelo. * Depurar y optimizar sistemáticamente la canalización de aprendizaje por refuerzo analizando tanto la eficiencia computacional como las métricas de rendimiento de aprendizaje. Abordar problemas como ruido en la señal de recompensa, estrategias de exploración y divergencia de políticas para mejorar la convergencia y la estabilidad. * Colaborar con equipos multifuncionales para integrar agentes de aprendizaje por refuerzo en sistemas de producción. Definir métricas claras de éxito, como mejoras en el rendimiento del mundo real y robustez bajo condiciones variadas, y garantizar el monitoreo continuo y refinamientos iterativos para una adaptación sostenida al dominio. * Tener un título en Ciencias de la Computación o campo relacionado. Preferiblemente doctorado en PLN, Aprendizaje Automático o campo afín, complementado con un historial sólido en I+D de IA (con buenas publicaciones en conferencias A\*). * Es fundamental contar con experiencia demostrada en experimentos de aprendizaje por refuerzo a gran escala, incluyendo técnicas de RL en línea como Group Relative Policy Optimization (GRPO). Tus contribuciones deben haber generado mejoras medibles en la toma de decisiones específica del dominio y en el rendimiento general de las políticas. * Se requiere un profundo conocimiento de los algoritmos de aprendizaje por refuerzo, incluyendo métodos de vanguardia de RL en línea y otros enfoques de optimización basados en gradientes como gradientes de política, actor-crítico y GRPO. Tu experiencia debe enfatizar mejorar la estabilidad de políticas, la exploración y la eficiencia de muestras en entornos complejos y dinámicos. * Es imprescindible tener una sólida experiencia en PyTorch y frameworks relevantes de aprendizaje por refuerzo. Se espera experiencia práctica en el desarrollo de canalizaciones de RL, desde simulación y entrenamiento en línea hasta evaluación posterior al entrenamiento e implementación de soluciones basadas en RL en entornos de producción. * Demostrar capacidad para aplicar investigación empírica para superar desafíos del aprendizaje por refuerzo, como ineficiencia de muestras, equilibrio entre exploración y explotación, e inestabilidad en el entrenamiento. Debes ser competente en diseñar marcos de evaluación robustos e iterar sobre innovaciones algorítmicas para seguir ampliando los límites del rendimiento de los agentes de RL. **Información importante para candidatos** Los fraudes en reclutamiento se han vuelto cada vez más comunes. Para protegerte, ten en cuenta lo siguiente al postularte a vacantes: * **Postúlate únicamente a través de nuestros canales oficiales.** No utilizamos plataformas o agencias de terceros para contratación, salvo que se indique claramente. Todas las vacantes disponibles se publican en nuestra página oficial de carreras: https://tether.recruitee.com/ * **Verifica la identidad del reclutador.** Todos nuestros reclutadores tienen perfiles verificados en LinkedIn. Si tienes dudas, puedes confirmar su identidad revisando su perfil o contactándonos a través de nuestro sitio web. * **Ten cuidado con métodos de comunicación inusuales.** No realizamos entrevistas por WhatsApp, Telegram o SMS. Toda la comunicación se realiza a través de correos electrónicos oficiales de la empresa y plataformas designadas. * **Verifica doblemente las direcciones de correo.** Toda comunicación proveniente de nosotros tendrá direcciones que terminen en **@**tether.to **o @**tether.io * **Nunca solicitaremos pagos ni datos financieros.** Si alguien solicita información financiera personal o un pago en cualquier momento durante el proceso de contratación, es un fraude. Por favor, informa inmediatamente. **Cuando tengas dudas, no dudes en contactarnos a través de nuestro sitio web oficial.**


