La pareidolia è un fenomeno affascinante che ci porta a vedere volti e forme familiari in oggetti inanimati. Questo tema è stato recentemente approfondito da un studio condotto dal laboratorio di informatica e intelligenza artificiale del MIT (CSAIL), il quale ha creato un dataset innovativo di 5.000 immagini pareidoli, superando notevolmente le collezioni precedenti.
Il termine pareidolia può sembrare complesso, ma è un concetto che molti di noi hanno sperimentato senza rendersene conto. Un noto esempio è quello della designer di gioielli della Florida, Diana Duyser, che nel 1994 scoprì l’immagine della Vergine Maria in un toast. Questa scoperta le permise di vendere il panino per la sorprendente cifra di 28.000 dollari. La domanda che sorge è: quanto comprendiamo veramente questo fenomeno?
La Ricerca su Pareidolia al MIT
Mark Hamilton, uno studente di dottorato al MIT, ha guidato la ricerca con l’obiettivo di comprendere come sia gli esseri umani che le intelligenze artificiali percepiscano queste immagini illusorie. “La pareidolia facciale ha da tempo affascinato gli psicologi, ma è stata poco esplorata nella comunità della visione artificiale,” ha dichiarato Hamilton. I risultati ottenuti da questa ricerca hanno portato a scoperte sorprendenti riguardo alle differenze tra percezione umana e meccanica.
Uno dei risultati più interessanti suggerisce che i modelli di intelligenza artificiale non riconoscono i volti pareidoli come facciamo noi. Alla squadra di ricerca è sembrato che, addestrando gli algoritmi a riconoscere volti animali, questi avessero migliorato la loro capacità di individuare i volti pareidoli. Questa connessione inattesa potrebbe indicare un legame evolutivo tra la nostra capacità di identificare volti animali, fondamentale per la sopravvivenza, e la nostra inclinazione a vedere facce negli oggetti inanimati.
Il “Goldilocks Zone of Pareidolia”
Un altro aspetto intrigante della ricerca riguarda quella che gli studiosi chiamano la “Zona di Goldilocks della Pareidolia”. Si tratta di una categoria di immagini in cui la pareidolia è più probabile che si verifichi. Secondo William T. Freeman, professor al MIT e principale investigatore del progetto, esiste un intervallo specifico di complessità visiva in cui sia gli esseri umani che le macchine sono più propensi a percepire facce in oggetti che facce non sono.
Se l’immagine è troppo semplice, non presenta abbastanza dettagli per evocare un volto; se è eccessivamente complessa, risulta in un rumore visivo che confonde. I ricercatori hanno sviluppato un’equazione per modellare come le persone e gli algoritmi rilevano volti illusori, rivelando un chiaro picco pareidolo dove la probabilità di vedere facce è massima, corrispondente a immagini che presentano “giusto il giusto” livello di complessità.
Il Dataset e le Implicazioni Future
Il dataset ”Faces in Things” è molto più ampio rispetto agli studi precedenti, che tipicamente includevano solo 20-30 stimoli. Grazie a questa vasta raccolta di immagini, gli studiosi hanno potuto analizzare il comportamento degli algoritmi più avanzati di rilevamento facciale dopo averli addestrati sui volti pareidoli. Questo ha mostrato non solo che gli algoritmi possono essere modificati per riconoscere questi volti, ma anche che possono servire come sostituti silicici del nostro stesso cervello.
Per creare questo dataset, la squadra ha selezionato circa 20.000 immagini candidate dal dataset LAION-5B, che sono state poi etichettate e valutate da annotatori umani. Questo processo ha richiesto un grande impegno e molte ore di lavoro, incluso il contributo di Hamilton, il cui madre ha dedicato innumerevoli ore a etichettare le immagini per l’analisi.
Applicazioni Pratiche e Futuro della Ricerca
Le implicazioni dello studio sono molteplici, in particolare nell’ambito del miglioramento dei sistemi di rilevamento facciale, riducendo i falsi positivi. Questo può avere conseguenze significative per settori come le auto a guida autonoma, l’interazione uomo-computer e la robotica. Inoltre, il dataset potrebbe tra l’altro aiutare nel design di prodotti, offrendo spunti su come comprendere e controllare la pareidolia per sviluppare prodotti più attrattivi.
Come ad esempio, si potrebbe immaginare di modificare automaticamente il design di un’auto o di un giocattolo affinché appaia più amichevole. Hamilton spiega che è affascinante come gli esseri umani interpretino istintivamente oggetti inanimati con tratti umani, mentre gli algoritmi non riconoscono naturalmente queste facce caricaturali nello stesso modo. Questo porta a domande intriganti sulle differenze tra percezione umana e interpretazione algoritmica, e sull’eventualità che la pareidolia possa essere vantaggiosa o svantaggiosa.
Conclusione e Prospettive Futura
Con la preparazione per condividere il proprio dataset con la comunità scientifica, i ricercatori al MIT stanno già pensando a future direzioni di ricerca. Un ulteriore passo potrebbe coinvolgere l’addestramento di modelli di visione-linguaggio per capire e descrivere meglio i volti pareidoli, avvicinando ulteriormente i sistemi AI alla nostra interpretazione visiva.
In conclusione, la ricerca di Hamilton e dei suoi colleghi ha aperto nuove prospettive sulla comprensione della pareidolia e sull’interazione tra esseri umani e macchine. Questo settore sta guadagnando attenzione e i risultati potrebbero insegnarci qualcosa di prezioso su come il nostro sistema visivo funziona ben oltre l’addestramento ricevuto nel corso della vita.