Google aggiorna le norme sulla privacy riguardo all’addestramento dei modelli IA con dati pubblici

17/08/2023

Google ha recentemente aggiornato le proprie norme sulla privacy per chiarire che i dati pubblici degli utenti possono essere utilizzati per l’addestramento dei modelli di intelligenza artificiale (IA), come ad esempio quello alla base del chatbot denominato “Bard”. Questo cambiamento è stato effettuato in vista dell’entrata in vigore della legge AI Act, che renderà obbligatoria la trasparenza riguardo all’utilizzo di dati pubblici per il training di modelli di IA. Tuttavia, nonostante questo aggiornamento, il chatbot dell’azienda, Google Bard, non è ancora accessibile in Europa a causa di questioni di privacy.

Dati pubblici in pasto all’IA

La nuova versione delle politiche sulla privacy è stata pubblicata il 1 luglio. In essa, Google ha confermato di raccogliere dati da fonti pubbliche online, come parte del processo di addestramento dei modelli di intelligenza artificiale. Prima dell’aggiornamento, la sezione “Fonti accessibili pubblicamente” menzionava il possibile utilizzo di tali informazioni per migliorare funzionalità come Google Traduttore. Con l’aggiornamento, tuttavia, è stato specificato che questi dati pubblici possono essere impiegati anche per creare nuovi prodotti e funzionalità, tra cui il chatbot Bard e le funzionalità di AI Cloud.

Attenzione alla condivisione di informazioni sensibili

Google ha sottolineato che i dati pubblici degli utenti non si limitano solo alle informazioni presenti nei servizi Google, ma comprendono tutte le informazioni condivise online. Ciò include dati pubblicati su blog, forum e social media. Di conseguenza, gli utenti sono invitati a prestare molta attenzione a ciò che condividono pubblicamente, specialmente per quanto riguarda informazioni sensibili.

Controversie riguardanti lo scraping dei dati

Recentemente, un importante studio legale statunitense ha denunciato sia OpenAI che Microsoft per aver “rubato” i dati degli utenti senza il loro consenso. Inoltre, Twitter ha adottato misure di sicurezza per limitare la lettura dei tweet, al fine di prevenire lo scraping dei dati.

Aggiornamento da Google

In risposta alle preoccupazioni sollevate riguardo all’utilizzo dei dati pubblici per l’addestramento dei modelli IA, Google ha fornito uno statement in cui sottolinea che le norme sulla privacy sono da tempo trasparenti riguardo a questa pratica. L’azienda afferma che ha sempre utilizzato informazioni pubblicamente disponibili dal web per addestrare modelli linguistici per servizi come Google Traduttore. L’ultimo aggiornamento delle norme ha semplicemente incluso servizi più recenti come Bard, ed è stato effettuato con il fine di garantire la conformità ai principi e alle misure di salvaguardia della privacy nello sviluppo delle tecnologie di intelligenza artificiale, in linea con i loro Principi sull’IA.

Google aggiorna le norme sulla privacy riguardo all’addestramento dei modelli IA con dati pubblici

Dati pubblici in pasto all’IA

Attenzione alla condivisione di informazioni sensibili

Controversie riguardanti lo scraping dei dati

Aggiornamento da Google

Condividi

Alcuni nostri clienti

Compet-e srl

Centro privacy e compliance.