




Resumen: Este puesto implica ser responsable del núcleo de IA de un nuevo producto, centrándose en construir un sistema de producción que sea preciso, eficiente desde el punto de vista de costos y mejore continuamente. Aspectos destacados: 1. Ser el responsable del núcleo de IA de un nuevo producto utilizado por miles de clientes 2. Centrarse en lanzar y mejorar un sistema de producción, no en investigación 3. Iterar continuamente sobre la calidad basándose en señales reales de los clientes Caseproof es la empresa detrás de MemberPress, la plataforma de membresía para WordPress más utilizada. Somos una empresa privada, rentable y autofinanciada. Estamos desarrollando un nuevo producto impulsado por IA y buscamos al ingeniero que será responsable del substrato de IA que lo alimenta. **El puesto** Serás el responsable del núcleo de IA de un nuevo producto que será utilizado semanalmente por miles de clientes que pagan. Tubo de inferencia, recuperación, control de versiones de prompts, suite de evaluación, disciplina de costos, bucle de mejora de modelos... todo ello. Este es un puesto orientado al lanzamiento, no a la investigación. No entrenamos modelos ni publicamos artículos. Construimos un sistema de producción que debe ser preciso, económico de ejecutar y mejorar constantemente mes tras mes. Informarás directamente al líder senior de ingeniería y trabajarás junto a un equipo pequeño y enfocado. **Lo que harás** * Diseñar y ejecutar el tubo de inferencia. Generación aumentada con recuperación y llamadas estructuradas a herramientas, respuestas fundamentadas en citas, enrutamiento de modelos según niveles. * Gestionar el control de versiones de prompts y la suite de evaluación. Evaluaciones reales, con casos adversarios y puertas bloqueadoras para lanzamientos. Aquí no se aprueban evaluaciones basadas en "vibraciones". * Gestionar la telemetría de costos y la disciplina de costos. Límites por usuario, aplicación obligatoria del enrutamiento de modelos, almacenamiento en caché y detección de abusos. El producto incluye una versión gratuita; tú eres responsable de garantizar su rentabilidad a escala. * Construir el bucle de retroalimentación que permita que el sistema mejore con el tiempo. * Iterar continuamente sobre la calidad basándose en señales reales de los clientes. **Qué necesitamos** * Has lanzado personalmente al menos un producto o característica impulsada por LLM en producción, en el que confían usuarios reales. Puedes describir sus prompts, evaluaciones y telemetría de costos en detalle porque tú los diseñaste. * Has experimentado y superado al menos uno de los siguientes: desviación de prompts, regresión por versión de modelo, degradación de la calidad de recuperación, sobrecoste, incidente de alucinación o fallo de la suite de evaluación que bloqueó un lanzamiento. * Fuerte experiencia en ingeniería full-stack. Conocimiento práctico de Python o TypeScript, Postgres y SQL, y capacidad para gestionar integraciones de extremo a extremo. * Experiencia con almacenes vectoriales (pgvector, Pinecone o equivalente). * Preferible experiencia práctica con la API de Anthropic; también se acepta experiencia con la API de OpenAI. * Consideras la desviación de prompts, la cobertura de evaluaciones, la disciplina de costos y los bucles de retroalimentación como superficies de ingeniería, no como aspectos secundarios. **Qué no necesitamos** * Científicos investigadores. No entrenamos modelos. * Envolturas de LangChain. Controlamos nuestra orquestación internamente. * CVs cargados de jerga de IA pero pobres en sistemas lanzados. **Compensación** Compensación generosa y estructura de bonos. Seguro médico, dental y de visión para empleados estadounidenses. Trabajo remoto desde el inicio, con preferencia por solapamiento horario con la zona horaria de las Montañas de EE.UU. **Cómo aplicar** Envía lo siguiente: * Una breve carta de presentación (menos de 300 palabras) describiendo el sistema más interesante impulsado por LLM que hayas lanzado, qué fue lo más difícil y qué harías de forma distinta la próxima vez. * Un enlace a un ejemplo de tu portafolio, repositorio de GitHub o artículo técnico que muestre tu trabajo. * CV. * Tu rango esperado de compensación y tu fecha más temprana de inicio. **Proceso** Avanzamos rápido: aproximadamente 2–3 semanas desde el inicio hasta la finalización. * Entrevista inicial de 30 minutos con el CEO. * Conversación técnica de 60–90 minutos con el líder de ingeniería. Explícanos en profundidad uno de tus sistemas LLM lanzados. * Proyecto de prueba remunerado de una semana con un problema bien definido. * Entrevista final. Oferta habitualmente dentro de las 48 horas.


