Gestionar y evitar el web scraping

AKA Web Scraping, scraping de precios, agregación de datos, recolección, minería, replicación, bots de scraping

Scraping 101

El scraping es el uso de herramientas automatizadas para recopilar grandes cantidades de datos de una aplicación con el fin de reutilizar o vender esos datos en otro lugar.

El scraping puede ser benigno o malicioso, dependiendo de la fuente, el objetivo y la frecuencia de las solicitudes. Por ejemplo, un bot de un motor de búsqueda que respete los índices de scraping definidos en el archivo robot.txt del sitio probablemente se considerará aceptable, mientras que el scraping de precios diario de un competidor no sea deseado.

 

Una de las 5 aerolíneas más importantes de Estados Unidos estaba perdiendo dinero

Los atacantes aumentaban los costes de infraestructura de la aerolínea y perjudicaban su capacidad de gestionar los ingresos, por lo que el equipo de seguridad se planteó el uso de Shape.

Estudio de caso: Una aerolínea internacional lucha contra el scraping de tarifas

Puntos clave:

  • Los agregadores de viajes utilizaron bots para descubrir y publicitar opciones de billetes ilícitas
  • El scraping representó el 25 % del tráfico en la URL de búsqueda principal
  • Los atacantes de scraping no deseados evadieron todas las soluciones de seguridad existentes antes de Shape

25 %

EL SCRAPING NO DESEADO SUPUSO EL 25 % DE TODO EL TRÁFICO DE BÚSQUEDA EN UNA SOLA URL.

Los 3 pasos del scraping

1. Escribir el script de ataque

Mediante el uso de herramientas automatizadas, scripts estándar o incluso proveedores de scraping como servicio, los atacantes pueden crear fácilmente scripts para descubrir y raspar el contenido del sitio web, incluyendo precios, promociones, artículos y metadatos.

Cómo los atacantes se hacen pasar por usuarios

El vicepresidente de Shape Intelligence muestra las técnicas que aprovechan los atacantes para imitar a los usuarios.

2. Recopilar datos

Las campañas de scraping pueden ser descaradas o sigilosas, dependiendo de las habilidades y los objetivos del atacante. La ejecución del script de scraping puede distribuirse entre cientos o miles de servidores para mezclarse con los patrones de tráfico de toda la población de usuarios de la empresa.

Su equipo de marketing puede ser el primero en experimentar los síntomas de los ataques de scraping, incluyendo la caída de las clasificaciones de búsqueda y la disminución de las tasas de conversión.

3. Monetización

Los datos extraídos pueden venderse, utilizarse para sitios de comparación de precios o incluso para crear sitios de imitación con fines fraudulentos.

Incluso si el atacante es un socio, las empresas pueden preferir que la parte recupere los datos de una API especificada, en lugar de consumir recursos costosos solicitando datos directamente de los servidores web.

Gestionar los ataques de scraping sin tener que gestionar una solución

Thank you! 

A Shape expert will contact you as soon as possible.