Haciendo una traducción literal del inglés «escarbar/rascar una website» , podemos hacernos una idea de lo que es el webscraping: es una técnica para obtener datos de manera automática de otra website.
En definitiva, es el antiguo sistema de copia de datos manual, pero ahora mediante softwares que simulan navegar y que en realidad extraen información.
Es una técnica extendida ya en todo el planeta, ya existen multitud de herramientas para poder llevar a cabo esta práctica de manera rápida, sencilla y barata, sólo hay que ver los comparadores de precio de seguros, viajes, hoteles….
¿Qué empresa no tiene website?, incluso ¿Qué profesional cualificado no tiene un pequeño blog donde su valor esta en el contenido de calidad aportado al visitante?. Todos sabemos la importancia del marketing de contenidos para conseguir relevancia y prestigio en los buscadores, y el dueño de un blog o de una website puede obtener enorme cantidad de contenido, el famoso Big Data, con muy poco esfuerzo, produciendo un perjuicio al creador original del contenido SINO SE HACE REFERENCIA A LA FUENTE DEL CONTENIDO.
Si tienes un portal web donde aportas contenido de calidad te preguntarás ¿ES LEGAL EL WEBSCRAPING? ¿SE PUEDE EVITAR? ¿ES DENUNCIABLE?
1º En primer lugar señalar que la obtención de información para uso particular, o la obtención haciendo referencia al origen de la información no es delito.
2º En segundo lugar, que existen números medios para protegerse de manera preventiva del web scraping, por ejemplo, añadiendo los famosos captchas (que que dificulta el acceso a los robots), deshabilitando cualquier tipo de interfaz de programación de aplicaciones, bloqueando la IP del usuario que ha conseguido obtener ya información……y por supuesto, AÑADIENDO UNA CLAUSULA EN LAS CONDICIONES LEGALES DE LAS WEBS.
Las empresas que practican esta técnica lo primero que hacen es ver la legislación del país y se leen la política legal de la website…es como en los robos, si un ladrón ve una casa con alarma y la otra no, ¿en cual va entrar?
3º En relación a la legislación, en la mayoría de países no existe una legislación clara y precisa respecto el webcraping en sí, y los tribunales aún no mantienen una postura uniforme, por ejemplo la Corte de los Estados Unidos de América reconoció que duplicar contenido no era ilegal, pero ya se observa una tendencia a proteger el contenido en las webs comerciales, por ejemplo, han fallado a favor de compañías áreas que sufrían esta práctica.
En España podemos decir que esta PRACTICA EN SÍ NO ES ILEGAL, pero que ES ILEGAL A TRAVÉS DE ESTA PRACTICA VIOLAR LOS DERECHOS DE AUTOR, PROPIEDAD INTELECTUAL O USO DE MARCA REGISTRADAS O ESTAR REALIZANDO COMPETENCIA DESLEAL.
Para ello debemos consultar la normativa al respecto , la Ley de Propiedad Intelectual, Ley de Marcas y Ley de Competencia Desleal.