




Resumen: Este puesto implica ser responsable del núcleo de IA de un nuevo producto, centrándose en construir un sistema de producción que sea preciso, rentable y mejore de forma continua. Aspectos destacados: 1. Ser propietario del núcleo de IA de un nuevo producto utilizado por miles de clientes 2. Centrarse en lanzar un sistema de producción, no en investigación 3. Mejorar continuamente la calidad del producto basándose en las señales de los clientes Caseproof es la empresa detrás de MemberPress, la plataforma de membresía para WordPress más utilizada. Somos una empresa privada, rentable y autofinanciada. Estamos desarrollando un nuevo producto impulsado por IA, y contratamos al ingeniero que será responsable del substrato de IA que lo alimenta. **El puesto** Serás responsable del núcleo de IA de un nuevo producto que será utilizado semanalmente por miles de clientes que pagan. Tubo de inferencia, recuperación, control de versiones de prompts, suite de evaluación, disciplina de costos, bucle de mejora de modelos... todo ello. Este es un puesto orientado al lanzamiento, no a la investigación. No entrenamos modelos ni publicamos artículos. Construimos un sistema de producción que debe ser preciso, económico de ejecutar y mejorar constantemente mes tras mes. Informarás directamente al líder senior de ingeniería y trabajarás junto a un equipo pequeño y enfocado. **Qué harás** * Diseñar y ejecutar el tubo de inferencia. Generación aumentada con recuperación y llamadas estructuradas a herramientas, respuestas fundamentadas en citas y enrutamiento de modelos según niveles. * Ser responsable del control de versiones de prompts y de la suite de evaluación. Evaluaciones reales, con casos adversariales y puertas de bloqueo para lanzamientos. Aquí no se aprueban evaluaciones basadas en "vibraciones". * Ser responsable de la telemetría de costos y de la disciplina de costos. Límites por usuario, aplicación forzosa del enrutamiento de modelos, almacenamiento en caché y detección de abusos. El producto incluye una versión gratuita; tú eres responsable de mantener su rentabilidad a gran escala. * Construir el bucle de retroalimentación que permita que el sistema mejore con el tiempo. * Iterar continuamente sobre la calidad basándote en señales reales de los clientes. **Qué necesitamos** * Has lanzado personalmente al menos un producto o característica impulsada por LLM en producción, que usuarios reales utilicen. Puedes describir sus prompts, evaluaciones y telemetría de costos en detalle porque los creaste tú. * Has experimentado y superado al menos uno de los siguientes: deriva de prompts, regresión por versión de modelo, degradación de la calidad de recuperación, sobrecoste, incidente de alucinación o fallo de la suite de evaluación que bloqueó un lanzamiento. * Fuerte experiencia en ingeniería full-stack. Conocimiento práctico de Python o TypeScript, comodidad con Postgres y SQL, capacidad para gestionar integraciones de extremo a extremo. * Experiencia con almacenes vectoriales (pgvector, Pinecone o equivalente). * Experiencia práctica preferible con la API de Anthropic; también se acepta la API de OpenAI. * Consideras la deriva de prompts, la cobertura de evaluaciones, la disciplina de costos y los bucles de retroalimentación como superficies de ingeniería, no como ideas secundarias. **Qué no necesitamos** * Científicos investigadores. No entrenamos modelos. * Envolturas de LangChain. Gestionamos nuestra orquestación internamente. * CVs cargados de jerga de IA pero pobres en sistemas lanzados. **Remuneración** Compensación generosa y estructura de bonos. Seguro médico, dental y de visión para empleados estadounidenses. Trabajo remoto desde el inicio, con preferencia por solapamiento horario con la zona horaria de las Montañas de EE.UU. **Cómo aplicar** Envía lo siguiente: * Una breve carta de presentación (menos de 300 palabras) describiendo el sistema más interesante impulsado por LLM que hayas lanzado, qué fue lo más difícil y qué harías de forma distinta la próxima vez. * Un enlace a un ejemplo de tu portafolio, repositorio de GitHub o artículo técnico que muestre tu trabajo. * Tu currículum. * Tu rango esperado de remuneración y tu fecha más temprana de inicio. **Proceso** Avanzamos rápidamente: unos 2–3 semanas desde el inicio hasta la finalización. * Entrevista inicial de 30 minutos con el CEO. * Conversación técnica de 60–90 minutos con el líder de ingeniería. Explícanos detalladamente uno de tus sistemas LLM lanzados. * Proyecto de prueba remunerado de una semana con un problema bien definido. * Entrevista final. Oferta habitualmente dentro de las 48 horas.


