Civile.it
/internet
Osservatorio sul diritto e telecomunicazioni informatiche, a cura del dott. V. Spataro dal 1999, 9266 documenti.

Il dizionario e' stato letto volte.



Segui via: Email - Telegram
  Dal 1999   spieghiamo il diritto di internet  Store  Podcast  Dizionario News alert    
             

  


WPkit.it: privacy, formulari, check up per WordPress

Temi attuali:
Algoritmi ChatGPT Intelligenza artificiale Privacy WordPress



Dizionario 21.01.2021    Pdf    Appunta    Letti    Post successivo  

Indicizzazione: cosa significa - dizionario

L'attività di catalogazione sui contenuti informatici. In questo caso niente a che vedere con il mondo finanziario.


Valentino Spataro

 

L

L'indicizzazione è l'attività di catalogare contenuti, tipicamente quelli pubblici del web.

Da una parte avviene la raccolta, contemporaneamente (o a posteriori) la catalogiazione, infine la consultazione.

La catalogazione è tipica dei progetti più sofisticati, apponendo metadati riguardanti i contenuti, a volte incrociandoli con le caratteristiche di chi le consulta.

Gli spider, crawler o simili sono i software che navigano il web secondo criteri più o meno deterministici a seconda delle finalità del progetto.

I catalogatori di solito operano in tempo reale, soprattutto quando le risorse da consultare sono limitate, magari indicate e aggiornate manualmente.

La consultazione è la parte "visibile" del lavoro: i risultati possono essere estratti con criteri di prevalenza su altri, non necessariamente in ordine cronologico. In questo settore i modelli commerciali sono i più vari.

La consultazione pubblica del web è una caratteristica che porta alcuni operatori ad affermare che i documenti sono pubblici, ma non vanno letti con software per offire i contenuti a terzi, per esempio. Alla base c'è il divieto di copiare e diffondere al posto dell'autore iniziale.

Altri appongono limiti assumendo ogni ragione possibile. Lo standard robots.txt è pensato per i motori di ricerca che condividono in pubblico i dati.

Le rassegne stampa sono state finalmente regolate anche in Italia e l'attività di indicizzazione (che con la direttiva europa potrebbe diventare a pagamento per le attività commerciali) si può realizzare a condizioni uguali per tutti.

Il diritto d'autore restare principe: si pensi all'aggregazione dei feed rss fatta dai singoli: non è commerciale ed è ad uso personale.

Si sottovaluta di solito che il web è per natura aperto: chi pubblica qualcosa lo fa per essere letto pubblicamente perchè questa è la natura della piattaforma. Chi non voglia essere indicizzato ha dalla sua moltissime tecniche, come quella che YouTube ha adottato negli ultimi mesi per impedire di leggere le loro pagine e usare solo le loro api.

Raramente si usa il termine indicizzare per contenuti locali in contesti ristretti: anche qui il software che indicizza accede a tutti i documenti disponibili nel contesto definito e li rende facilmente rintracciabili. Fra tutti, imperdibile, Search Everything per windows.

Chi volesse un elenco delle leggi in materia resterebbe sorpreso dal numero di esse.

Tra tutte ricordiamo quelle che riguardano la direttiva sugli intermediari e l'attuale proposta di regolamentazione dei servizi online che dovrebbe sostituire la direttiva ecommerce.

A distanza la direttiva sulle banche dati e la citata legge sul diritto d'autore.

Non sono estranee le norme sulla concorrenza sleale o comunicazione ingannevole per le consultazioni "calibrate" da algoritmi con valori impostati a favore o sfavore.

I social tipicamente affermano la condivisione dei dati e documenti dei propri utenti liberamente, poi nella realtà impongono accesso limitato alle API gestite in modo da dissuadere la condivisione, favorendo solo la condivisione interna alla piattaforma.

Tipicamente la catalogazione di .pdf e di .mp3 viene vista come pericolosa e proposta con meno frequenza, in consultazione, sui motori di ricerca.

L'indicizzazione è studiata dalla SEO, purtroppo non solo per migliorare il posizionamento organico tra i risultati di ricerca, ma anche per sviare i risultati delle ricerche verso i propri interessi, usando una infinità di tecniche in continuo sviluppo.

21.01.2021 Valentino Spataro



Incidente
Social Media Manager
ARC - protocollo
Legal Product Management
Pareidolia
Violazioni minori
Reverse proxy
PECR
Pretexting
CSAM Detection



Segui le novità in materia di Dizionario su Civile.it via Telegram
oppure via email: (gratis Info privacy)





dallo store:
visita lo store








Dal 1999 il diritto di internet. I testi sono degli autori e di IusOnDemand srl p.iva 04446030969 - diritti riservati - Privacy - Cookie - Condizioni d'uso - in 0.034