Alcuni ricercatori del New Jersey hanno trovato un metodo per risalire all’identità degli utenti, senza che il bersaglio si accorga di nulla.
Che si tratti di inserzionisti, operatori di marketing, criminali informatici o produttori di spyware sostenuti dai governi, sono in molti a voler identificare e tracciare gli utenti sul web.
Nonostante esista già una quantità impressionante di infrastrutture in grado di ottenere questo risultato, il desiderio di mettere le mani su dati e nuovi strumenti per raccoglierli si è dimostrato inarrestabile. In questo contesto, recentemente alcuni ricercatori del New Jersey Institute of Technology (Njit) hanno segnalato una tecnica innovativa che potrebbe essere utilizzata dagli aggressori per risalire all’identità dei visitatori dei siti web e potenzialmente ottenere molte informazioni legate alla vita digitale dei loro obiettivi.
Le scoperte, che i ricercatori dell’Njit presenteranno in occasione dello Usenix Security Symposium di Boston il mese prossimo, mostrano come – inducendo una persona a caricare un sito web dannoso – un aggressore sia in grado di determinare se l’utente in questione gestisce per esempio un indirizzo e-mail o un account sui social media, associandolo così a dati potenzialmente personali.
La scoperta dei ricercatori
Quando visitate un sito web, la pagina che state visualizzando può registrare il vostro indirizzo ip, ma non è detto che fornisca al proprietario del sito informazioni sufficienti per identificarvi.
La tecnica individuata dai ricercatori, invece, analizza alcune caratteristiche meno evidenti legate all’attività del potenziale bersaglio all’interno di un browser per determinare se è collegato a un account di servizi come YouTube, Dropbox, Twitter, Facebook, TikTok e altri ancora.
La violazione sarebbe eseguibile su tutti i principali browser, compreso Tor, noto per la protezione dell’anonimato.
“Se siete un utente medio di internet, è possibile che non pensiate troppo alla vostraprivacyquando visitate un sito web – spiega Reza Curtmola, uno degli autori dello studio e professore di informatica presso il Njit –.
Ma ci sono alcune categorie di utenti di internet che potrebbero subire ripercussioni più serie, come le persone che organizzano e partecipano a proteste politiche, i giornalisti e le persone che si collegano in rete con altri membri della minoranza di cui fanno parte. L’aspetto che rende pericolosi questi tipi di attacchi è che sono molto furtivi. È sufficiente visitare il sito web e non ci si accorge di essere stati esposti”.
“Supponiamo di avere un forum dedicato a estremisti o attivisti clandestini, che le forze dell’ordine ne abbiano preso segretamente il controllo – spiega Curtmola – e vogliano identificare gli utenti di questo forum, ma che non possano farlo direttamente perché gli utenti usano pseudonimi. Ma immaginiamo che le forze delle ordine siano anche riuscite a raccogliere un elenco di account Facebook che sospettano appartengano agli utenti del forum. In questo caso sarebbero in grado di associare chi visita il forum con i profili Facebook specifichi”.
Come funziona l’attacco
Anche se spiegarne il funzionamento è difficile, questo tipo attacco è relativamente facile da capire una volta fissati gli elementi fondamentali.
Chi esegue l’attacco ha bisogno di alcune cose per iniziare: un sito web che controlla, un elenco di account legati a persone che vuole identificare come visitatori di quel sito e dei contenuti pubblicati sulle piattaforme dagli account nel suo elenco di bersagli; questi contenuti consentono o bloccano la visualizzazione da parte dei bersagli (l’attacco funziona in entrambi i casi).
Successivamente, l’aggressore embedda il contenuto nel sito web che controlla, e aspetta di vedere chi clicca.
Se una persona che fa parte dell’elenco degli obiettivi visita il sito, gli aggressori riusciranno a risalire alla sua identità analizzando quali utenti possono (o non possono) visualizzare il contenuto incorporato.
L’attacco sfrutta una serie di fattori a cui la maggior parte delle persone non presta attenzione: molti dei principali servizi, da YouTube a Dropbox, consentono agli utenti di ospitare contenuti multimediali e di incorporarli in un altro sito.
È facile che le persone prese di mira dagli aggressori abbiano un account su questi servizi molto popolari, a cui, cosa fondamentale, spesso rimangono connessi sui loro telefoni o computer.
Questi servizi, infine, consentono agli utenti di limitare l’accesso ai contenuti che vengono caricati.
Per esempio, è possibile impostare il proprio account Dropbox in modo da condividere privatamente un video con uno o pochi utenti, oppure si può caricare un video su Facebook bloccandone la visualizzazione a determinati account.
Le funzioni per “bloccare” o “consentire” la visualizzazione dei contenuti rappresentano lo snodo cruciale che ha permesso ai ricercatori di capire come risalire alle identità degli utenti.
Nella versione dell’attacco in cui i bersagli visualizzano i contenuti, per esempio, i criminali informatici potrebbero condividere con un indirizzo Gmail di potenziale bersaglio una foto su Google Drive, embeddando poi la foto nella pagina web dannosa e attirandovi l’obiettivo. Quando i browser dei visitatori tentano di caricare la foto tramite Google Drive, gli aggressori sono in grado dedurre con precisione se l’utente è autorizzato ad accedere al contenuto, e quindi se ha il controllo dell’indirizzo e-mail in questione.
Grazie alle misure per la tutela della privacy attualmente a disposizione delle principali piattaforme, un aggressore non è in grado di verificare direttamente se il visitatore del sito è stato in grado di caricare il contenuto.
I ricercatori dell’Njit si sono però resi conto di poter analizzare le informazioni accessibili sul browser dell’obiettivo e il comportamento del suo processore durante la richiesta, per capire se la richiesta di visualizzazione del contenuto fosse stata consentita o negata.
La tecnica è nota come “attacco a canale laterale“: i ricercatori hanno scoperto di poter risalire in modo accurato e affidabile all’identità di un utente addestrando algoritmi di apprendimento automatico per analizzare dati apparentemente non correlati sul modo in cui il browser e il dispositivo della vittima elaborano la richiesta.
Una volta che l’aggressore sa che l’utente a cui ha permesso di visualizzare il contenuto lo ha effettivamente visto (o che l’utente a cui è stata negata la visualizzazione non è riuscito a vederlo) può determinare l’identità del visitatore del sito.
Possibili contromisure
Per quanto possa sembrare complicata, i ricercatori avvertono che la tecnica sarebbe semplice da mettere in campo una volta che gli aggressori hanno svolto il lavoro di preparazione.
Ci vorrebbero solo un paio di secondi per smascherare potenzialmente ogni visitatore del sito dannoso, e per un utente sarebbe virtualmente impossibile rilevare la violazione. I ricercatori hanno sviluppato un’estensione del browser in grado di contrastare questi attacchi, disponibile per Chrome e Firefox, sottolineando però che potrebbe avere un impatto sulle prestazioni e che non è disponibile per tutti i browser.
Attraverso un processo di divulgazione che ha coinvolto numerosi servizi web, browser e organismi che si occupano degli standard del web, i ricercatori riportano di aver avviato una discussione più ampia su come affrontare il problema in modo esauriente. Al momento, Chrome e Firefox non hanno risposto pubblicamente alle scoperte. Secondo Curtmola, per affrontare il problema a livello di chip sarebbero necessarie modifiche fondamentali e probabilmente irrealizzabili al modo in cui sono progettati i processori. Il ricercatore aggiunge però che una collaborazione nel quadro del World Wide Web Consortium o di altri forum permetterebbe di mettere a punto un soluzione che affronti in modo esteso il problema.