L’elaborazione di tecniche per misurare la qualità dei dati dei testi presenti nei dataset è un aspetto importante ai fini di sviluppare intelligenze artificiali sicure e responsabili. Molti team che sviluppano Language Models prevedono ormai una fase di creazione di dataset curati da usare come benchmark per filtrare i testi da somministrare ai modelli durante il pre-training.
data quality
Misurare la qualità dei dati: tecniche per IA sicure e responsabili
La performance dell’Intelligenza Artificiale è fortemente influenzata dalla selezione e dall’acquisizione dei dati di addestramento. È quindi fondamentale riconsiderare le strategie attuali, privilegiando la qualità dei dati rispetto alla quantità. Un focus sulla rappresentatività del campione e sul contesto di raccolta dei dati può migliorare significativamente le prestazioni dell’IA
Università degli Studi di Torino

Continua a leggere questo articolo
Argomenti
Canali
EU Stories - La coesione innova l'Italia