Civile.it
/internet
Osservatorio sul diritto e telecomunicazioni informatiche, a cura del dott. V. Spataro dal 1999, documenti.

Il dizionario e' stato letto volte.



Segui via: Email - Telegram
  Dal 1999   spieghiamo il diritto di internet  Store  Podcast  Dizionario News alert    
             

  


Dizionario 23.03.2017    Pdf    Appunta    Letti    Post successivo  

Web scraping: cosa significa - dizionario

La' dove non arriva la condivisione supplisce l'html
Spataro

 

E

E' la tecnica di leggere una pagina online ed estrarne dati (data mining)

Feed rss. Per anni Youtube ha offerto i feed rss per facilitare la fruizione dei canali e la condivisione dei video.

Poi chiusi i rubinetti, chiusi i feed.

Nessuno se ne è accorto, a parte i programmatori.

A questo punto si analizzano le pagine html e si estraggono da esse i contenuti.

Ci sono tante tecniche per rendere compatibili i dati con altre risorse.

Teniamo presente che non si tratta di attività illegali, a priori. Pensate i calendari, già riconosciuti aperti quando non siano "particolari".

Insomma: il diritto riconosce che certe informazioni date in pubblico non possono poi essere tutela di esclusiva e vietate a singoli. Se vai in pubblico, dici in pubblico, gli altri possono ripetere.

Ci sono altre norme che intervengono, ma spesso il web scraping serve proprio a dare più visibilità ai servizi "minati" (mined da data mining).

Ci sono comparatori, che leggono le offerte e le propongono poi a i propri clienti con link diretti al sito di origine.

Spesso il sito destinatario ha accordi commerciali ma si rifiuta di fornire dati tramite api o altri formati.

Resta quindi il web scraping. Il migliore è quello che elabora quantità di dati in modo talmente originale da realizzare dei meta servizi di interesse.

A memoria ricordo i metacrawler, meta motori di ricerca che ne interrogavano altri e restituivano i risultati ai propri utenti.

Ci sono fior di tecniche per impedire il web scraping, ma è la battaglia tra chi vuole farsi conosce e chi vuole aggiungere un altro anello nella filiera commerciale, oppure diventare dominante e sfruttare il lavoro altrui.

La tecnica va quindi valutata volta per volta, senza presumere nulla. Troppi gli usi possibili.

23.03.2017 Spataro



Etica e intelligenza artificiale
Boomer
Pagine spotted
Flooding
Schwa
AirTag
Giustizia predittiva
Chatcontrol
Giudizio Maggioritario
Accessibilità



Segui le novità in materia di Dizionario su Civile.it via Telegram
oppure via email: (gratis Info privacy)


Dossier:



dallo store:
visita lo store






Dal 1999 il diritto di internet. I testi sono degli autori e di IusOnDemand srl p.iva 04446030969 - diritti riservati - Privacy - Cookie - Condizioni d'uso - in 0.473