




**Ingeniero de Datos (Sistemas de Datos en Grafo/Neo4j/Python/Resolución de Entidades) · Senior · Remoto · LATAM** =============================================================================================== Estamos colaborando con una startup de salud en rápido crecimiento que está construyendo **infraestructura nativa de IA para la próxima generación de atención médica personalizada y preventiva**. Están desarrollando una plataforma integral de datos clínicos diseñada para una nueva era de la medicina, donde los datos fragmentados, longitudinales y multimodales se convierten en información accionable en tiempo real para médicos y equipos de atención. Esta plataforma unifica registros, laboratorios, dispositivos portátiles, diagnósticos, genómica y entradas de estilo de vida en un único modelo coherente del paciente. Entre los primeros clientes se incluyen clínicas líderes en medicina funcional, integrativa, longevidad y concierge, ayudando a moldear el producto desde el primer día. La misión: **transformar datos complejos de salud en claridad y acción**, sentando las bases para modelos predictivos de salud personal, inteligencia clínica adaptativa y gemelos digitales de salud. **Ingeniero de Datos Senior (Sistemas de Datos Basados en Grafos)** ==================================================== Este puesto es ideal para un ingeniero con **experiencia sólida en bases de datos en grafo** y que disfrute construir sistemas de datos complejos y escalables desde cero. Diseñarás la arquitectura central del grafo, los sistemas de linaje de datos, motores de coincidencia difusa y marcos de ingesta que impulsarán el futuro de la inteligencia en salud. **Responsabilidades Principales** ------------------------- ### **Arquitectura de Datos en Grafo** * Diseñar e implementar la **arquitectura principal de base de datos en grafo** de la empresa (probablemente Neo4j). * Crear modelos avanzados de grafos que representen pacientes, biomarcadores, protocolos, eventos y relaciones a través de datos multimodales. * Habilitar consultas de alto contexto como *"encontrar pacientes con patrones longitudinales similares."* ### **Normalización de Datos \& Resolución de Entidades** * Construir todo el motor de normalización y eliminación de duplicados. * Implementar **coincidencia difusa \& resolución de entidades** para unificar datos de salud desordenados y provenientes de múltiples fuentes. * Establecer reglas, heurísticas, puntuaciones de confianza y tuberías automatizadas de unificación. ### **Metadatos, Linaje \& Procedencia** * Diseñar una capa de linaje transparente donde cada punto de datos registre: + fuente + marca de tiempo + fiabilidad + ruta de transformación + puntuación de confianza * Garantizar trazabilidad completa desde la ingesta hasta el almacenamiento y cálculo. ### **Sistemas de Datos en Serie Temporal \& Longitudinales** * Diseñar almacenamiento optimizado para **señales de alta frecuencia en serie temporal** (CGM, dispositivos portátiles, diagnósticos). * Soportar análisis longitudinal a largo plazo a lo largo del ciclo de vida del paciente. ### **Capa de API \& Motor de Consultas** * Construir APIs que permitan consultas complejas en grafos y recorridos de múltiples relaciones. * Soportar patrones de acceso tanto en tiempo real como analíticos. ### **Ingesta de Datos de Salud Multifuente** * Diseñar la ingesta para: + registros clínicos (EHR) + laboratorios + dispositivos portátiles + entradas de estilo de vida/comportamiento + dispositivos de monitoreo continuo + diagnósticos avanzados y genómica * Unificar estos datos en un modelo canónico estructurado y de alta calidad. **Habilidades Requeridas** ------------------- ### **Imprescindibles** * **Experiencia profunda y práctica con bases de datos en grafo (Neo4j o similares).** * Fuerte modelado de datos basado en grafos y relacional. * Experiencia con algoritmos de **coincidencia difusa \& resolución de entidades**. * Experiencia en sistemas de **metadatos, linaje y procedencia**. * Arquitectura de datos en serie temporal y diseño de datos longitudinales. * Diseño de API para consultas complejas de múltiples saltos. * Fuerte dominio de **Python \+ SQL**. * Sólido **diseño de sistemas**, especialmente en escalabilidad y rendimiento. ### **Deseables** * Conocimientos en grafos de conocimiento o modelado semántico de datos. * Haber construido plataformas de datos completas de extremo a extremo. * Experiencia normalizando datos desordenados de múltiples fuentes. * Kafka, Pub/Sub u otros marcos de transmisión. * Conocimiento de datos de salud: FHIR, HL7\. * Experiencia con extracción o enriquecimiento de características impulsadas por ML\. **Lo que Puedes Esperar** ----------------------- * Trabajo remoto al 100% * Contratación como contratista independiente * Rol de alto impacto con responsabilidad desde el primer día * Trabajar junto a un equipo fundador de élite en salud y IA * Construir infraestructura fundamental para la próxima década de la atención sanitaria * Entorno dinámico y orientado al producto **Candidato Ideal** ------------------- * Se desenvuelve bien en entornos iniciales con alta responsabilidad. * Le apasiona construir sistemas complejos desde cero. * Disfruta los desafíos técnicos profundos con impacto real. * Cree en el poder de los datos para transformar la atención sanitaria. ### **Lo que Ofrece Darwoft** * Contrato como independiente con pago en USD * Trabajo remoto al 100% * Feriados nacionales de Argentina * Clases de inglés * Programa de referidos * Acceso a plataformas de aprendizaje Explora esta y otras oportunidades en: www.darwoft.com/careers


