Programma che si collega ai siti internet per leggerne il contenuto e indicizzare o inserirne il contenuto nei motori di ricerca. Sono programmi che permettono, tra i vari sistemi disponibili, di ampliare la base di dati contenuta in un motore di ricerca. Se un motore di ricerca copia i contenuti di altri siti o altri motori di ricerca fa qualcosa che avviene spesso in internet, ma alla stregua delle leggi vigenti deve essere considerata un'attività almeno di concorrenza sleale e di violazione della normativa sul diritto d'autore e delle banche dati. Per questo, spesso tra le parti intervengono accordi per regolare i rapporti. Google copia in un proprio archivio le pagine che trova, elaborandole. IusSeek, invece, indicizza, cioè estrae dalle pagine che trova le informazioni che ritiene utili in base ai criteri forniti senza copiare l'intera pagina. Gli spider in generale, al di là della copia o dell'indicizzazione, visitano siti internet e operano delle elaborazioni in base ad un numero di criteri particolarmente evoluti, pur semplici, in funzione di vari parametri tecnici quali l'importanza di una pagina e la frequenza con cui è visitata. Ogni motore di ricerca rielabora i dati già forniti rielaborati dallo spider in modo da realizzare un archivio il più utile possibile. Gli spider, per ovviare ai problemi di tutela dei diritti sopra accennati, di solito prevedono la possibilità che certi files non vengano indicizzati o copiati, se contenuti in files chiamati robots.txt. La soluzione è solo tecnica e non risolve il problema giuridico. Diverso è un metamotore di ricerca che, per funzionare, consulta altri motori di ricerca e si appropria dei risultati e li rielabora secondo criteri non verificabili, spesso ma non sempre originali. Solo alcuni metamotori si limitano a consultare più motori contemporaneamente, mostrando all'utente finale le pagine così come vengono visualizzate dai costitutori le banche dati consultate dai motori di ricerca. Sono chiamati anche Web crawlers.
WPkit.it: privacy, formulari, check up per WordPress
Temi attuali:
Algoritmi ChatGPT Intelligenza artificiale Privacy WordPress
P
1-bit LLM Incidente Social Media Manager ARC - protocollo Legal Product Management Pareidolia Violazioni minori Reverse proxy PECR Pretexting
|
dallo store:
visita lo store
Affiliazioni
Agcm
Agcom
Banche dati
Bitcoin
Blockchain
Chatbot
ChatGPT
Clausole
Cloud
Contratti
Cookie
Copyright
Crittografia
Dark Patterns
Democrazia
Disclaimer
Distribuzione
Domini
Ecommerce
Editoria
Email
Email aziendale
Esercitazioni
Fare impresa
Fattura
GDPR
Hardware
Immagini
Intelligenza A.
Iot
Legal Design
Marchi
Marketing
Mobile
Modelli
Open data
Open Source
Penale
Policy
Primi passi
Privacy
Pubblicita'
Riservate
Sentenze
Sicurezza
Software
Sorveglianza
Startup
Tributario
Turismo
Ugc
Video
Voicebot