La possibilità di falsificare i dati biometrici umani grazie all’intelligenza artificiale – ora le impronte digitali – delinea un futuro ancora più inquietante e imprevedibile per gli esperti della sicurezza.
Secondo alcuni ricercatori della New York University e della Michigan University sarebbe possibile “hackerare” le impronte digitali di un individuo. La possibilità sarebbe consentita da un sistema in grado di imitare più del 20% delle impronte digitali presenti su un qualsiasi sistema biometrico. Il suo nome è DeepMasterPrints, ed il suo tasso di errore sarebbe pari quasi all’uno per mille.
La possibilità di riprodurre l’impronta digitale si basa su due delle peculiarità su cui si fonda il sistema di riconoscimento: la prima è data dall’incapacità della maggioranza degli scanner biometrici di leggere per intero l’immagine dell’impronta che viene acquisita, dato che la lettura avviene parzialmente in funzione della parte effettivamente acquisita; la seconda è data dalla conformazione di alcune caratteristiche delle impronte digitali che hanno delle similarità con le altre.
L’utilizzo del deep learning
Un’impronta digitale artificiale, pertanto, se munita di numerose similarità, può avere maggiori possibilità di ingannare un rilevatore. In altri termini, il funzionamento del sistema ingannatore si basa sul confronto dell’immagine rilevata con una serie di immagini precedentemente memorizzate, estrapolando impronte parziali fino all’assemblaggio dell’immagine finale dell’impronta originale.
Ovviamente l’intero sistema è basato su un’architettura di apprendimento automatico meglio nota come Generative Adversial Networks (GANs), in grado di generare nuove impronte digitali partendo da quelle precedentemente immagazzinate. La rete neurale utilizzata è di tipo deep learning, ovvero in grado di imparare a svolgere delle attività con una precisione, in termini di riconoscimento delle immagini, mai ottenuta finora grazie anche alla presenza di due reti che si contrappongo l’una all’altra (ciò spiega il termine adversial).
Il GANs si basa sull’utilizzo di algoritmi generativi, al contrario di quelli discriminatori che cercano di classificare i dati di input, cioè date le caratteristiche di un’istanza di dati predicono un’etichetta o una categoria a cui appartengono quei dati. Ad esempio, considerate tutte le parole in una e-mail, un algoritmo discriminante potrebbe prevedere se il messaggio è spam o non è spam (spam è un’etichetta e il gruppo di parole raccolte dalle e-mail sono le caratteristiche che costituiscono i dati di input). Quindi gli algoritmi discriminanti mappano le caratteristiche alle etichette e sono interessati unicamente a quella correlazione.
Quell’idea che piace tanto a Facebook
Gli algoritmi generativi fanno l’opposto. Anziché predire un’etichetta in base a determinate funzioni, tentano di prevedere le caratteristiche fornite dall’etichetta stessa. In funzione dell’esempio della e-mail, la domanda a cui un algoritmo generativo cerca di rispondere è la seguente: supponendo che una determinata e-mail sia spam, quanto sono probabili queste caratteristiche? Una rete neurale, chiamata generatore, genera nuove istanze di dati, mentre l’altra, il discriminatore, le valuta per autenticità. In altri termini, il discriminatore decide se un’istanza di dati che analizza appartiene al set di dati di addestramento effettivo oppure no.
Introdotti nel 2014 da Ian Goodfellow[1], insieme ad altri ricercatori dell’Università di Montreal, i GANs hanno riscosso successo anche in casa Facebook, come testimoniato[2] da Yann LeCun, Direttore dell’Area Ricerca Intelligenza Artificiale, che ha definito il sistema come “l’idea più interessante degli ultimi dieci anni”.
Il potenziale dei GANs è effettivamente enorme, dato che possono imparare a imitare qualsiasi distribuzione di dati. È possibile insegnare loro a creare perfino mondi stranamente simili ai nostri in qualsiasi dominio, nel campo della musica, delle immagini, del linguaggio, raggiungendo confini impensabili e imprevisti. E gli esempi sono già realtà.
Il 25 ottobre del 2018, nella casa d’aste Christie’s è stata effettuata una vendita particolarmente insolita: nell’ambito dell’evento Prints & Multiples è stata proposta la tela “ritratto di Edmond Belamy” alla modica cifra di 432.000 dollari[3]. L’aspetto interessante è legato al fatto che si tratta del primo dipinto realizzato non certo da un pittore di fama, ma da un GANs progettato e sviluppato da Obvious[4], un trio di studenti francesi poco più che ventenni il cui obiettivo è di “spiegare e democratizzare” l’uso dell’intelligenza artificiale attraverso l’arte.
Difficile immaginare a cosa ci condurrà questa innovazione. L’interesse manifestato da Facebook potrebbe condurre alla costruzione di algoritmi capaci di produrre dei profili identici a quelli degli utenti reali ma in grado di sostituirsi ad essi in caso di necessità? Oppure potrebbe rappresentare l’apoteosi delle tecniche utilizzate nel mondo del cybercrime, ad esempio utilizzando un algoritmo di tipo dictionary attack in grado di analizzare le password più comuni in un sistema informatico per costruirne una in grado di consentire l’accesso al sistema.
Va evidenziato che DeepMasterPrints ha permesso non solo di creare innumerevoli immagini di impronte digitali, ma anche di produrre dei fake capaci di ingannare anche l’occhio umano, superando la tecnica che crea impronte irregolari in grado di ingannare uno scanner, ma non certo un’analisi visiva. Philip Bontrager, team leader dei ricercatori della New York University, ha asserito: “Al giorno d’oggi è impossibile riuscire a verificare se un dato biometrico proviene da una persona reale”. È un’affermazione che allarma parecchio…
_________________________________________________________
- https://arxiv.org/abs/1406.2661 ↑
- https://www.quora.com/What-are-some-recent-and-potentially-upcoming-breakthroughs-in-deep-learning ↑
- https://www.theverge.com/2018/10/23/18013190/ai-art-portrait-auction-christies-belamy-obvious-robbie-barrat-gans ↑
- http://obvious-art.com/ ↑