CAPTCHA: misura di sicurezza o business dei dati?

Uno studio recente condotto dall’Università della California, Irvine, ha evidenziato le criticità e l’inefficacia dei CAPTCHA, i sistemi utilizzati dai siti web per distinguere gli utenti reali dai bot.

L’indagine è durata 13 mesi ed è stata condotta prendendo in esame oltre 3.600 partecipanti. In particolare è stato analizzato il funzionamento del servizio reCAPTCHA di Google.

 

La ricerca

I risultati sono stati sorprendenti: non solo hanno mostrato che questi strumenti non riescono a bloccare efficacemente il traffico automatizzato, ma hanno sollevato anche problemi legati alla privacy a causa dell’uso di cookie di tracciamento.

Inoltre, i ricercatori hanno stimato che i CAPTCHA abbiano fatto perdere miliardi di ore agli utenti, generando al contempo quasi mille miliardi di dollari di valore in dati per Google, che ha acquisito reCAPTCHA nel 2009.

La ricerca ha preso in esame le due tipologie di CAPTCHA più diffuse: quelli “invisibili”, che analizzano il comportamento dell’utente, e quelli basati sul riconoscimento di immagini. Entrambe le varianti si sono rivelate utili per Google, sia per l’ottimizzazione della pubblicità mirata sia per l’addestramento di modelli di intelligenza artificiale.

Dallo studio emerge inoltre che i sistemi automatizzati (bot) sono ora più veloci ed efficienti degli esseri umani nel risolvere i CAPTCHA.

Analizzando il lasso di tempo compreso tra il 2010 e il 2023, i ricercatori hanno stimato che:

  • Gli utenti hanno impiegato complessivamente 819 milioni di ore per risolvere i CAPTCHA;
  • Il valore del tempo sprecato dagli utenti equivale a circa 6,1 miliardi di dollari (prendendo come base il salario minimo statunitense);
  • Sono stati consumati 134 Petabyte di larghezza di banda;
  • L’inquinamento generato è pari a circa 3,4 milioni di kg di CO₂.

 

Lo studio ha inoltre calcolato il valore economico dei dati raccolti da Google attraverso reCAPTCHA:

  • Il dataset di immagini etichettate ha un valore compreso tra 8,75 e 32,3 miliardi di dollari;
  • I cookie di tracciamento generati hanno un valore a vita stimato in 888 miliardi di dollari.

 

Le conclusioni

Nelle conclusioni dello studio, i ricercatori affermano che il vero scopo di reCAPTCHA non sarebbe garantire la sicurezza online, bensì servire da strumento per raccogliere dati a scopo di lucro, mascherandosi da servizio di protezione. Per questo motivo suggeriscono che dovrebbe essere abbandonato, poiché non apporta un contributo significativo alla sicurezza o al funzionamento di Internet.

A due anni dalla pubblicazione dello studio e nonostante le evidenze emerse, non vi sono segnali che i CAPTCHA vengano progressivamente eliminati. La ricerca solleva così importanti interrogativi etici sull’utilizzo di questi sistemi e sul valore dei dati degli utenti nell’economia digitale.

Condividi