Nuova minaccia per la sicurezza dell'Intelligenza Artificiale
Una nuova tecnica di cyberattacco, denominata 'Man in the Prompt', è stata scoperta, mettendo a rischio gli strumenti di intelligenza artificiale (IA) come ChatGPT e Google Gemini. Questa vulnerabilità sfrutta le estensioni del browser per iniettare istruzioni dannose nei prompt di questi strumenti.
Come funziona l'attacco 'Man in the Prompt'
La società di sicurezza informatica LayerX ha rivelato che l'attacco si basa sulla struttura dell'interfaccia dei chatbot, dove i campi di input dei prompt sono parte del Document Object Model (DOM) della pagina. Qualsiasi estensione del browser con accesso base al DOM può leggere o alterare ciò che gli utenti digitano nei prompt AI, anche senza permessi speciali.
LayerX ha dimostrato come un'estensione con permessi minimi può iniettare un prompt in ChatGPT, estrarre la risposta dell'IA e rimuovere la cronologia chat dalla vista dell'utente. Per Google Gemini, un'estensione compromessa può iniettare prompt per accedere ed esfiltrare dati sensibili dell'utente, inclusi email e contatti, anche quando la barra laterale di Gemini è chiusa.
Implicazioni per la sicurezza dei dati
Questo tipo di attacco rappresenta un punto cieco per gli strumenti di sicurezza tradizionali. Poiché gli strumenti AI basati su browser spesso elaborano informazioni sensibili, gli utenti potrebbero incollare dati aziendali riservati in queste interfacce. Inoltre, alcune applicazioni IA interne addestrate su set di dati proprietari possono essere esposte se le estensioni del browser interferiscono con il prompt o estraggono contenuti dai campi di risposta.
Raccomandazioni per la protezione
LayerX raccomanda alle organizzazioni di rivedere le proprie strategie di sicurezza per ispezionare il comportamento del browser, monitorare le interazioni DOM all'interno degli strumenti AI per rilevare attività sospette, bloccare estensioni rischiose in base al loro comportamento e prevenire attivamente la manomissione dei prompt e l'esfiltrazione dei dati in tempo reale a livello di browser.
Costi delle violazioni dei dati
Un'analisi del 2024 ha rivelato che il costo medio di una violazione dei dati per le aziende è salito a 4,37 milioni di euro in Italia. Un rapporto di Verizon del 2023 ha evidenziato che il 74% delle violazioni di dati coinvolge l'elemento umano, come phishing o errori di configurazione.
Attacchi 'Task-in-Prompt' (TIP)
Una nuova classe di attacchi, noti come attacchi 'Task-in-Prompt' (TIP), incorpora compiti specifici nei prompt per aggirare le protezioni dei modelli linguistici, evidenziando la necessità di strategie di difesa più sofisticate.