La domanda è tipica delle mie parti: "a chi appartieni?" sta per "di quale famiglia/gruppo/squadra/banda fai parte?" Con questa domanda questo mese mi avventuro nel cercare di spiegare come funzionano (a grandissime linee, niente di rigoroso, eh?) i cosiddetti algoritmi di clustering. Ora, purtroppo con gli algoritmi abbiamo imparato ad avere una certa familiarità: quelli di cui vorrei parlarvi però non ci diranno se la nostra regione di residenza è gialla, arancione o rossa, bensì come raggruppare gli oggetti simili tra loro. In fondo è qualcosa che facciamo spesso, soprattutto chi soffre di manie ossessivo-compulsive: conosco persone che ripongono i libri negli scaffali raggruppandoli in gruppi omogenei per altezza, colore o casa editrice. Ammetto di farlo anche io ogni tanto. O che dispongono i barattoli in modo ordinato nella dispensa (non è il mio caso: in cucina regna da sempre un bel disordine). Per non parlare delle manie negli armadi: magliette colorate e ordinate secondo la lunghezza d'onda del colore principale (purtroppo conosco molti fisici), camicie tutte uguali riposte in una posizione calcolata sull'ultimo lavaggio e così via...
Il punto è che raggruppare gli oggetti non è soltanto una mania, ma a volte è strettamente necessario, soprattutto quando gli oggetti (i dati) sono davvero tanti (avete presente i big data, no?): una visione di insieme è possibile soltanto dopo aver organizzato i dati in gruppi. E naturalmente una procedura automatica per poterlo fare sarebbe l'ideale.
