Civile.it
/internet
Osservatorio sul diritto e telecomunicazioni informatiche, a cura del dott. V. Spataro dal 1999, 9332 documenti.

Il dizionario e' stato letto volte.



Segui via: Email - Telegram
  Dal 1999   spieghiamo il diritto di internet  Store  Podcast  Dizionario News alert    
             

  


WPkit.it: privacy, formulari, check up per WordPress

Temi attuali:
Algoritmi ChatGPT Intelligenza artificiale Privacy WordPress



Dizionario 11.04.2023    Pdf    Appunta    Letti    Post successivo  

LLM: cosa significa - dizionario

Large Linguistic Models


Valentino Spataro

 

I

I modelli linguistici "larghi" sono modelli linguistici basati su reti neurali che categorizzano in milioni di modi, individuati dalle macchine stesse, i dati grezzi che ricevono.

Non si tratta solo di avere big data. Si tratta di avere strumenti di apprendimento che individuano milioni di criteri che comparano tra di loro velocemente, per dare il senso che le macchine attribuiscono ai dati grezzi sulla base di operazioni statistiche, ma contestualizzate.

Ogni categorizzazione è infatti legata al contesto in cui è categorizzata, e il contesto stesso aiuta la categorizzazione. Entrambi sono individuati dalle macchine che poi vengono instruite per cercare di descrivere la categorizzazione agli umani, senza capirne il senso, ma solo osservando che vi è un senso, secondo gli umani.

ChatGPT4 è talmente brava ad individuare le sfumature nei dati grezzi che sembra essere in grado di capire nessi di causalità e richieste teleologiche degli interventi umani durante le conversazioni.

Le risposte sono sempre più legate ad un apparente nesso di causalità e di finalità. Per molti questo sembra derivare da un bias durante l'apprendimento rinforzato con il contributo di molti esseri umani.

Per me la ricerca di cause e fini è insita in ogni documento umano. Tutti cerchiamo di capire le cause, le soluzioni e prevedere il futuro.

Altrimenti vivremmo solo di presente senza speranze.

L'elaborazione dei dati grezzi per generare dati sintetici (anonimizzati senza poter tornare indietro) è anche uno dei grandi temi di confronto privacy. Il mancato consenso sulla raccolta dei dati grezzi, così come fanno i motori di ricerca, si trasferisce sull'utilizzo dei modelli anonimizzati ?

In Minority Report la ricerca di senso è individuata per maggioranza, ad indice che le macchine spesso rispondono con sensi diversi, perchè statisticamente scelgono altre vie plausibili. Ecco gli errori di fatto: sono strumento non per restituire dati di fatto, ma elaborazioni. Se chiediamo loro di sommare numeri, probabilmente ci possono raccontare che 2+2=5 o dare altre informazioni sbagliate, ma statisticamente correlate in modo per adeguato per la macchina.

Dobbiamo anche sapere noi come interrogarle. Senza associare il dato grezzo al dato sintetico e al suo output.

Il tema è aperto, e ne parleremo ancora.

11.04.2023 Valentino Spataro



Dati neurali
Dati comuni
Gemello digitale
Generative AI
ERD
Zanshin Tech
OTA
Boosting
1-bit LLM
Incidente



Segui le novità in materia di Dizionario su Civile.it via Telegram
oppure via email: (gratis Info privacy)





dallo store:
visita lo store








Dal 1999 il diritto di internet. I testi sono degli autori e di IusOnDemand srl p.iva 04446030969 - diritti riservati - Privacy - Cookie - Condizioni d'uso - in 0.048