Spazio Sponsor

Indicizzazione

L'attività di catalogazione sui contenuti informatici. In questo caso niente a che vedere con il mondo finanziario.

L'indicizzazione e' l'attività di catalogare contenuti, tipicamente quelli pubblici del web.

Da una parte avviene la raccolta, contemporaneamente (o a posteriori) la catalogiazione, infine la consultazione.

La catalogazione e' tipica dei progetti piu' sofisticati, apponendo metadati riguardanti i contenuti, a volte incrociandoli con le caratteristiche di chi le consulta.

Gli spider, crawler o simili sono i software che navigano il web secondo criteri piu' o meno deterministici a seconda delle finalità del progetto.

I catalogatori di solito operano in tempo reale, soprattutto quando le risorse da consultare sono limitate, magari indicate e aggiornate manualmente.

La consultazione e' la parte "visibile" del lavoro: i risultati possono essere estratti con criteri di prevalenza su altri, non necessariamente in ordine cronologico. In questo settore i modelli commerciali sono i piu' vari.

La consultazione pubblica del web e' una caratteristica che porta alcuni operatori ad affermare che i documenti sono pubblici, ma non vanno letti con software per offire i contenuti a terzi, per esempio. Alla base c'e' il divieto di copiare e diffondere al posto dell'autore iniziale.

Altri appongono limiti assumendo ogni ragione possibile. Lo standard robots.txt e' pensato per i motori di ricerca che condividono in pubblico i dati.

Le rassegne stampa sono state finalmente regolate anche in Italia e l'attività di indicizzazione (che con la direttiva europa potrebbe diventare a pagamento per le attività commerciali) si puo' realizzare a condizioni uguali per tutti.

Il diritto d'autore restare principe: si pensi all'aggregazione dei feed rss fatta dai singoli: non e' commerciale ed e' ad uso personale.

Si sottovaluta di solito che il web e' per natura aperto: chi pubblica qualcosa lo fa per essere letto pubblicamente perche' questa e' la natura della piattaforma. Chi non voglia essere indicizzato ha dalla sua moltissime tecniche, come quella che YouTube ha adottato negli ultimi mesi per impedire di leggere le loro pagine e usare solo le loro api.

Raramente si usa il termine indicizzare per contenuti locali in contesti ristretti: anche qui il software che indicizza accede a tutti i documenti disponibili nel contesto definito e li rende facilmente rintracciabili. Fra tutti, imperdibile, Search Everything per windows.

Chi volesse un elenco delle leggi in materia resterebbe sorpreso dal numero di esse.

Tra tutte ricordiamo quelle che riguardano la direttiva sugli intermediari e l'attuale proposta di regolamentazione dei servizi online che dovrebbe sostituire la direttiva ecommerce.

A distanza la direttiva sulle banche dati e la citata legge sul diritto d'autore.

Non sono estranee le norme sulla concorrenza sleale o comunicazione ingannevole per le consultazioni "calibrate" da algoritmi con valori impostati a favore o sfavore.

I social tipicamente affermano la condivisione dei dati e documenti dei propri utenti liberamente, poi nella realtà impongono accesso limitato alle api gestite in modo da dissuadere la condivisione, favorendo solo la condivisione interna alla piattaforma.

Tipicamente la catalogazione di .pdf e di .mp3 viene vista come pericolosa e proposta con meno frequenza, in consultazione, sui motori di ricerca.

L'indicizzazione e' studiata dalla seo, purtroppo non solo per migliorare il posizionamento organico tra i risultati di ricerca, ma anche per sviare i risultati delle ricerche verso i propri interessi, usando una infinità di tecniche in continuo sviluppo.

Spataro

21.01.2021 https://



Partecipa anche tu:
  • Cosa pensi della voce ?
  • Commenta o chiedi:
tutti i dati sono facoltativi e informatici e li usiamo solo per rispondervi. No newsletter. Si applica la privacy policy di IusOnDemand srl.


Ti possono interessare anche:
  • 95395
  • 2021-01-21
  • Indicizzazione
  • L'attività di catalogazione sui contenuti informatici. In questo caso niente a che vedere con il mondo finanziario.

  • L'indicizzazione e' l'attività di catalogare contenuti, tipicamente quelli pubblici del web.

    Da una parte avviene la raccolta, contemporaneamente (o a posteriori) la catalogiazione, infine la consultazione.

    La catalogazione e' tipica dei progetti piu' sofisticati, apponendo metadati riguardanti i contenuti, a volte incrociandoli con le caratteristiche di chi le consulta.

    Gli spider, crawler o simili sono i software che navigano il web secondo criteri piu' o meno deterministici a seconda delle finalità del progetto.

    I catalogatori di solito operano in tempo reale, soprattutto quando le risorse da consultare sono limitate, magari indicate e aggiornate manualmente.

    La consultazione e' la parte "visibile" del lavoro: i risultati possono essere estratti con criteri di prevalenza su altri, non necessariamente in ordine cronologico. In questo settore i modelli commerciali sono i piu' vari.

    La consultazione pubblica del web e' una caratteristica che porta alcuni operatori ad affermare che i documenti sono pubblici, ma non vanno letti con software per offire i contenuti a terzi, per esempio. Alla base c'e' il divieto di copiare e diffondere al posto dell'autore iniziale.

    Altri appongono limiti assumendo ogni ragione possibile. Lo standard robots.txt e' pensato per i motori di ricerca che condividono in pubblico i dati.

    Le rassegne stampa sono state finalmente regolate anche in Italia e l'attività di indicizzazione (che con la direttiva europa potrebbe diventare a pagamento per le attività commerciali) si puo' realizzare a condizioni uguali per tutti.

    Il diritto d'autore restare principe: si pensi all'aggregazione dei feed rss fatta dai singoli: non e' commerciale ed e' ad uso personale.

    Si sottovaluta di solito che il web e' per natura aperto: chi pubblica qualcosa lo fa per essere letto pubblicamente perche' questa e' la natura della piattaforma. Chi non voglia essere indicizzato ha dalla sua moltissime tecniche, come quella che YouTube ha adottato negli ultimi mesi per impedire di leggere le loro pagine e usare solo le loro api.

    Raramente si usa il termine indicizzare per contenuti locali in contesti ristretti: anche qui il software che indicizza accede a tutti i documenti disponibili nel contesto definito e li rende facilmente rintracciabili. Fra tutti, imperdibile, Search Everything per windows.

    Chi volesse un elenco delle leggi in materia resterebbe sorpreso dal numero di esse.

    Tra tutte ricordiamo quelle che riguardano la direttiva sugli intermediari e l'attuale proposta di regolamentazione dei servizi online che dovrebbe sostituire la direttiva ecommerce.

    A distanza la direttiva sulle banche dati e la citata legge sul diritto d'autore.

    Non sono estranee le norme sulla concorrenza sleale o comunicazione ingannevole per le consultazioni "calibrate" da algoritmi con valori impostati a favore o sfavore.

    I social tipicamente affermano la condivisione dei dati e documenti dei propri utenti liberamente, poi nella realtà impongono accesso limitato alle API gestite in modo da dissuadere la condivisione, favorendo solo la condivisione interna alla piattaforma.

    Tipicamente la catalogazione di .pdf e di .mp3 viene vista come pericolosa e proposta con meno frequenza, in consultazione, sui motori di ricerca.

    L'indicizzazione e' studiata dalla SEO, purtroppo non solo per migliorare il posizionamento organico tra i risultati di ricerca, ma anche per sviare i risultati delle ricerche verso i propri interessi, usando una infinità di tecniche in continuo sviluppo.

  • https://
  • https://www.civile.it/internet/images/20212021-01-21_123619.jpg
  • Valentino Spataro
  • Valentino Spataro
  • dizionario,tecniche,motori di ricerca,spider,robots
  • S
  • -
  • -
  • 0
  • Ilaw - Lavorare con internet
  • 2
  • 0
  • N
  • -
  • 1938
  • -
  • 0
  • -
  • -
  • -
  • -