




Resumen: Block Labs busca un Ingeniero de Plataforma de Datos para diseñar, construir y mantener una plataforma de datos escalable destinada a la toma de decisiones en tiempo real y a la modelización predictiva en los ámbitos de Web3, IA y juegos de azar en línea (iGaming). Aspectos destacados: 1. Trabajar en la vanguardia de Web3, IA y juegos de azar en línea (iGaming) 2. Ser responsable de todo el flujo de datos en tiempo real, de extremo a extremo 3. Colaborar con expertos en un equipo con alta autonomía **Acerca de Block Labs** ==================== Block Labs es un estudio tecnológico de primer nivel que opera en la vanguardia de **Web3, Inteligencia Artificial y juegos de azar en línea (iGaming)**. No nos limitamos a entregar funciones; diseñamos plataformas de producción a gran escala que impulsan la próxima generación de productos digitales. Somos un colectivo de ingenieros senior, estrategas de producto y constructores que se niegan a hacer concesiones en cuanto a arquitectura. Ya sea que estemos diseñando sistemas de IA multiagente autónomos, construyendo infraestructura financiera descentralizada o arquitectando plataformas de juegos de azar en línea de alta frecuencia, nuestro estándar es la excelencia. Avanzamos rápidamente, pero construimos para el largo plazo. Si buscas trabajar junto a un equipo que valora la profundidad de la experiencia técnica, el diseño reflexivo de sistemas y la propiedad del producto, Block Labs es tu lugar. **El puesto** ============ Los datos y la inteligencia ahora ocupan un lugar central en varios productos que estamos desarrollando, y necesitamos una plataforma que sea tanto fiable como capaz de soportar, con el tiempo, inteligencia más avanzada. Este puesto refleja ese cambio. Estamos diseñando una nueva plataforma de datos que actuará como columna vertebral para todo, desde la toma de decisiones en tiempo real hasta la modelización predictiva. Como Ingeniero de Plataforma de Datos en el Equipo de Datos, serás responsable de todo el flujo de datos en tiempo real, de extremo a extremo, proporcionando datos a través de un almacén analítico unificado y una capa de entrega de características (feature-serving layer). No estarás construyendo paneles de control (dashboards). Estarás diseñando el sistema nervioso comercial de una plataforma multiinquilino concebida para escalar desde un operador hasta diez veces más, con un costo marginal de infraestructura. **Principales responsabilidades:** ========================= * Diseñar, construir y mantener flujos de datos escalables mediante AWS Glue (PySpark) u otras herramientas equivalentes de orquestación y transformación. * Diseñar y optimizar el almacén ClickHouse para lograr tiempos de respuesta subsegundos en todas las oficinas centrales (back-offices). * Implementar contratos de datos entre las oficinas centrales (back-office) y la plataforma. La incorporación de un nuevo operador implica únicamente un cambio de configuración, no la creación de nuevas tablas, temas (topics) ni vistas de características (feature views). * Construir la capa de entrega de características (feature-serving layer), que proporcione características precalculadas a agentes de IA con latencia en milisegundos. * Integrar con bases de datos de terceros, APIs de oficinas centrales (back-office) y sistemas externos (CRM, afiliados, plataformas de adquisición). * Establecer procedimientos de supervisión, alertas y mantenimiento, incluidas comprobaciones de estado del flujo de datos, monitoreo de actualidad (freshness), detección de anomalías y cumplimiento de los acuerdos de nivel de servicio (SLA) de los contratos de datos. * Ser responsable de CI/CD e infraestructura como código (infrastructure-as-code) para cargas de trabajo de datos. * Colaborar con científicos de datos, ingenieros de agentes, desarrolladores de BI y equipos de infraestructura para traducir los requisitos de datos en flujos de trabajo confiables y listos para producción. **Acerca de ti:** ============== * 3 o más años construyendo y operando flujos de datos en producción a escala, con experiencia práctica tanto en paradigmas de procesamiento por lotes (batch) como de transmisión continua (streaming). * Conocimientos especializados en Apache Kafka (o Amazon MSK): diseño de temas (topics), gestión de grupos de consumidores (consumer groups), manejo de offsets, operaciones con registro de esquemas (schema registry) y resolución de problemas en producción relacionados con retrasos (lag), redistribución de particiones (rebalancing) y problemas de rendimiento (throughput). * Sólidas habilidades en SQL y en ingeniería de almacenes de datos: experiencia con bases de datos analíticas columnares (se prefiere especialmente ClickHouse, aunque también son válidas alternativas similares como Druid, BigQuery o Redshift). * Competencia en PySpark / Spark Streaming: escritura de trabajos de transformación que normalicen, enriquezcan y apliquen reglas de negocio sobre flujos de eventos. Experiencia con AWS Glue, Apache Airflow o Apache NiFi constituye un plus importante. * Disciplina en modelado de datos: capacidad para diseñar esquemas normalizados y multiinquilino, donde el aislamiento entre inquilinos (tenant isolation) se logra mediante filtros, no mediante bifurcaciones (forks). Experiencia en contratos de datos y gobernanza de esquemas. * Experiencia en CI/CD e infraestructura como código: pruebas automatizadas de flujos de datos, despliegues bajo control de versiones (CloudFormation, Terraform o CDK), y familiaridad con cargas de trabajo contenerizadas (ECS Fargate o Kubernetes). * Mentalidad orientada a la calidad y observabilidad de los datos: experiencia implementando monitoreo del estado de los flujos de datos, validación automatizada de datos (Great Expectations o equivalente), comprobaciones de actualidad (freshness checks) y detección de anomalías. **Deseable** ================ * Experiencia en plataformas de juegos de azar en línea (iGaming), casinos en línea, póker o casas de apuestas deportivas (sportsbook). * Conocimiento de flujos de transacciones nativos de blockchain o criptomonedas, incluida la ingesta de eventos en cadena (on-chain event ingestion), contabilidad denominada en tokens o liquidación en stablecoins. * Capacidad para operar eficientemente en un entorno nativo de AWS (MSK, Glue, S3, DynamoDB, ECS, IAM). Comprendes los compromisos inherentes al uso de arquitecturas sin servidor (serverless) y puedes dimensionar la infraestructura para lograr eficiencia de costos. * Experiencia con almacenes de características (feature stores) (SageMaker, Feast o Tecton), construyendo flujos de características fuera de línea y en línea que sirvan a modelos de aprendizaje automático (ML) en tiempo de inferencia. * Experiencia previa en industrias reguladas (servicios financieros, juego de azar, fintech), donde la trazabilidad de los datos (data lineage), la auditabilidad y el cumplimiento normativo son requisitos ineludibles. * Experiencia migrando motores de consulta heredados (Athena, Trino, Presto) a almacenes analíticos modernos, utilizando marcos de reconciliación para validar su corrección. **Cómo trabajamos** =============== * Trabajo completamente remoto con comunicación asincrónica como prioridad. Se prefiere cierta superposición horaria con la zona horaria de la UE. * Equipo pequeño y altamente autónomo dentro de la función de Datos. Informas directamente al Director de Datos y coordinas con los equipos de IA, BI e Infraestructura. * Las decisiones arquitectónicas se documentan y debaten. Participarás en revisiones de diseño y serás responsable de las decisiones técnicas relativas a tu dominio. * Construimos desde el primer día pensando en la escala multiinquilino. Cada flujo de datos, esquema y contrato que entregues debe poder integrar un nuevo operador sin requerir intervención técnica adicional. * Se establecerá una rotación de guardias (on-call) durante la fase operativa. Durante la fase de construcción, el foco está en la velocidad con calidad. No hay que resolver emergencias derivadas de sistemas heredados. **¿Qué tipo de cultura puedo esperar? Madura, orientada a la misión y con bajo ego. Valoramos la claridad por encima del ruido, los resultados por encima del espectáculo y el ritmo sin caos. Si eres una de las mentes más brillantes en tu disciplina y deseas construir junto a otros expertos, aquí te sentirás como en casa.


