Categorías
···
Entrar / Registro
Ingeniero Senior de Extracción de Datos Web e Infraestructura de Datos
2,636,450-4,101,145 ARS/año
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

**Acerca del puesto** Buscamos un Ingeniero Senior para hacerse cargo de nuestra canalización de datos inmobiliarios. Diseñarás, construirás y operarás infraestructura de extracción de datos que ingiera más de 300 000 anuncios inmobiliarios diarios procedentes de fuentes protegidas. Este no es un puesto centrado en la creación de scripts. Diseñarás sistemas distribuidos y tolerantes a fallos que funcionen de forma autónoma con una disponibilidad casi perfecta. Deberás sentirte tan cómodo discutiendo estrategias de rotación de proxies como diseñando arquitecturas basadas en colas. Has experimentado fallos de extracción a las 2:00 a.m. y sabes cómo evitar que vuelvan a ocurrir. Lo que harás Diseñar y operar sistemas distribuidos de extracción de datos que procesen más de 300 000 registros diarios con una fiabilidad superior al 99,5 %. Diseñar canalizaciones de procesamiento paralelo con trabajadores concurrentes, limitación inteligente de velocidad y escalado horizontal. Superar soluciones empresariales anti-bot (Cloudflare, PerimeterX, DataDome, Akamai) mediante la gestión de huellas digitales y la optimización de proxies. Implementar monitoreo y alertas que detecten fallos antes de que afecten a los sistemas posteriores. Mantener la calidad de los datos mediante validación automatizada y detección de anomalías. Qué buscamos **Experiencia:** 5+ años en ingeniería de software, con al menos 3 años centrados específicamente en la extracción masiva de datos web. Has gestionado sistemas en producción que procesan más de 250 000 registros/día y has superado plataformas anti-bot importantes. **Conocimientos técnicos:** Experto en Python o Node.js. Sólida experiencia con asyncio, multiprocesamiento y arquitecturas distribuidas de trabajadores. Conocimiento profundo de los fundamentos de HTTP, navegadores sin interfaz gráfica (Puppeteer/Playwright) e infraestructura de proxies. Experiencia con AWS/GCP, Docker, Kubernetes y colas de mensajes. **Experiencia en tecnologías anti-bot:** Comprendes la huella digital del navegador, las firmas TLS (JA3/JA4) y las ventajas e inconvenientes de los proxies residenciales, de centros de datos y de proveedores de servicios de internet (ISP). Estás familiarizado con proveedores empresariales como Oxylabs o Bright Data, o similares. **Valor añadido:** Experiencia con datos inmobiliarios (MLS, Realtor.com, Zillow). Antecedentes en ingeniería inversa de ofuscación JavaScript. Este puesto no es para ti si... Tu experiencia se centra principalmente en herramientas gestionadas como ScraperAPI, Apify o Scrapy Cloud. Has desarrollado extracciones de datos pero nunca las has operado a largo plazo en producción. No puedes explicar la diferencia entre proxies residenciales y de centros de datos, ni por qué es relevante. Nunca has tenido que depurar por qué una extracción de datos dejó de funcionar repentinamente. Tipo de empleo: A tiempo completo Remuneración: $2 636 450,00 - $4 101 145,00 por mes Ubicación laboral: Teletrabajo Fecha prevista de inicio: 26/01/2026

Fuentea:  indeed Ver publicación original
Sofía González
Indeed · HR

Compañía

Indeed
Sofía González
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.