Rischio sicurezza IA con vulnerabilità software su schermo

Quanto è pericolosa l’IA di Anthropic, Mythos?

Mese scorso Anthropic ha annunciato che il suo nuovo modello, Claude Mythos Preview, è così efficace nel trovare vulnerabilità di sicurezza da non rilasciarlo al pubblico. Sarà disponibile solo per un gruppo selezionato di aziende che potranno usarlo per scansionare e fixare il proprio software. L’annuncio va contestualizzato, ma contiene una verità importante.

Mythos è molto bravo a scovare vulnerabilità. Ma non è il solo. L’AI Security Institute del Regno Unito ha scoperto che OpenAI GPT-5.5, già disponibile pubblicamente, ha capacità simili. L’azienda Aisle ha riprodotto i risultati pubblicati da Anthropic con modelli più piccoli e meno costosi.

Allo stesso tempo, la decisione di non rilasciare Mythos sa un po’ di necessità trasformata in virtù. Il modello è costosissimo da far funzionare e Anthropic non sembra avere le risorse per un lancio generalizzato. Cosa c’è di meglio per alzare la valutazione della società se non accennare a capacità non dimostrate e lasciare che altri ripetano le affermazioni?

Detto questo, la sostanza è preoccupante. I sistemi di IA generativa – non solo Anthropic, ma anche OpenAI e modelli open source – stanno diventando molto bravi a trovare e sfruttare falle nei software. E questo ha conseguenze enormi per la cybersecurity: sia in attacco che in difesa.

Gli attaccanti useranno queste capacità per identificare e bucare automaticamente sistemi di ogni tipo. Entreranno in sistemi critici in tutto il mondo, a volte per piazzare ransomware e fare soldi, a volte per rubare dati con finalità di spionaggio, a volte per prendere il controllo in caso di conflitto. Il mondo diventerà più pericoloso e imprevedibile.

Ma allo stesso tempo i difensori useranno le stesse capacità per trovare e correggere molte di quelle falle. Mozilla ha usato Mythos per individuare 271 vulnerabilità in Firefox. Sono state corrette e non saranno mai più sfruttabili. In futuro, IA che trovano e fixano automaticamente vulnerabilità in tutti i software sarà la norma nello sviluppo, portando a software molto più sicuri.

Non è così semplice, ovviamente. Ci aspetta un diluvio sia di attaccanti che usano vulnerabilità scoperte di fresco per entrare nei sistemi, sia di aggiornamenti software molto più frequenti per ogni app e dispositivo. Ma molti sistemi non sono patchabili, e molti di quelli che lo sono non ricevono patch. Così molte vulnerabilità resteranno aperte. Trovare e sfruttare sembra comunque più facile che trovare e correggere.

Tutto questo indica un breve periodo di maggiore pericolo. Le organizzazioni dovranno adattare la loro sicurezza a questa nuova realtà. Ma è sul lungo termine che dobbiamo concentrarci.

Mythos non è unico, ma è più capace di molti modelli precedenti. Ed è meno capace di quelli che arriveranno. Le IA sono molto migliori a scrivere software rispetto a sei mesi fa. C’è ogni motivo per credere che continueranno a migliorare, e quindi a scrivere software sempre più sicuri. Il risultato finale darà ai difensori potenziati dall’IA un vantaggio sugli attaccanti potenziati dall’IA.

Andando oltre, le stesse capacità di ricerca, pattern matching e ragionamento che rendono questi modelli bravi ad analizzare software si applicano quasi certamente a sistemi simili. Il codice fiscale non è codice informatico, ma è una serie di algoritmi con input e output. Ha vulnerabilità: le chiamiamo scappatoie fiscali. Ha exploit: le chiamiamo strategie di elusione fiscale. E ha hacker in nero: avvocati e commercialisti.

Allo stesso modo in cui questi modelli trovano centinaia di vulnerabilità in sistemi software complessi, è lecito aspettarsi che siano altrettanto efficaci nel trovare nuove scappatoie fiscali inesplorate. Le grandi banche d’investimento probabilmente ci stanno già lavorando in segreto. Hanno dato in pasto all’IA il codice fiscale degli Stati Uniti, o del Regno Unito, o di tutti i paesi industrializzati, e hanno chiesto di trovare strategie per risparmiare. Quante scappatoie troveranno? Dieci? Cento? Mille?

Il Double Dutch Irish Sandwich è una scappatoia che coinvolge più giurisdizioni fiscali. Le IA possono trovare scappatoie ancora più complesse? Non ne abbiamo idea. Certo, le IA produrranno un sacco di trucchi che non funzionano, ma è lì che entrano in gioco avvocati e commercialisti: per verificare, giustificare e commercializzare le scappatoie presso i loro clienti facoltosi.

Così come il codice fiscale, ogni altro sistema complesso di regole e strategie. Questi modelli potrebbero essere incaricati di trovare falle nelle norme ambientali, o in quelle sulla sicurezza alimentare – ovunque ci siano sistemi normativi complessi e persone potenti che vogliono eluderle. Le conseguenze saranno peggiori di semplici computer insicuri.

Le scappatoie fiscali fanno sì che i governi raccolgano meno entrate, e quelle regolatorie permettono ai potenti di aggirare le regole. Tutto con pesanti ricadute sociali. E mentre i fornitori di software possono correggere i loro sistemi in giorni, ci vogliono anni per modificare un codice fiscale. Senza contare che il processo è politico, con lobbisti che fanno pressione per non correggere. Basti pensare alla carried interest loophole, una scappatoia fiscale statunitense sfruttata da decenni. Vari governi hanno tentato di chiuderla, ma i legislatori non riescono a resistere ai lobbisti abbastanza a lungo per sistemarla.

Le tecnologie IA sono pronte a rimodellare gran parte della società. Come la rivoluzione industriale ha dato agli umani la capacità di consumare calorie fuori dal corpo su larga scala, la rivoluzione IA darà agli umani la capacità di eseguire compiti cognitivi fuori dal corpo su larga scala. I nostri sistemi non sono progettati per questo: sono pensati per ritmi cognitivi umani. Lo stiamo già vedendo nel diluvio di vulnerabilità software che questi modelli trovano e sfruttano. E lo vedremo presto in un diluvio di vulnerabilità in tutti gli altri sistemi di regole. Adattarsi a questa nuova realtà sarà difficile, ma non abbiamo scelta.

Articoli simili