Metodo per organizzare dati eterogenei ed individuare gli elementi anomali.
All'interno di una banca dati vengono organizzati i cluster con dati omogenei, vicini, simili, con i criteri che ognuno definisce.
Il sistema permette di mostrare temi simili da una banca dati i cui dati sono eterogenei. Ma anche di individuare quei dati che il sistema non riesce a organizzare.
I cluster sono gruppi di dati omogonei.
I pattern sono i criteri individuati per raggruppare dati secondo criteri ricorrenti.
L'individuazione di pattern, nel 2020, è misto lavoro culturale e informatico, anche grazie all'intelligenza artificiale, anzi, grazie al settore dell'apprendimento più o meno automatico.
I dataset invece sono dati raccolti a mano attorno ad un criterio definito, tramite una attività svolta "in laboratorio", per avere un esempio di dati corretti con i quali far apprendere una macchina.