LA TECNOLOGIA TI STA SPIANDO: COME PUÒ L’INTELLIGENZA ARTIFICIALE (AI) PREVENIRLO?

Gli ascoltatori umani percepiscono l’audio mimetico come un rumore di fondo e non hanno problemi a riconoscere le parole pronunciate. Neural Voice Camouflage, una nuova tecnologia che fornisce protezione, è ora disponibile. Emette rumori audio unici mentre parli. Questo confonde l’intelligenza artificiale (AI), che trasduce il parlato registrato.

Bossware è uno strumento utilizzato dalle aziende per monitorare i desktop dei propri dipendenti. Una varietà di applicazioni spyware può registrare le telefonate. Amazon Echo, un gadget domestico, può registrare le conversazioni quotidiane.

Questa nuova tecnologia utilizza quello che viene chiamato un “approccio contraddittorio”. Implica l’apprendimento automatico, che cerca schemi nei dati e modifica i suoni in modo che un’IA possa scambiarli per qualcos’altro. In sostanza, utilizzi un’IA per ingannarne un’altra.

L’IA di apprendimento automatico deve prima organizzare tutte le clip audio prima di poterle regolare per nasconderti.

Gli esperti hanno addestrato una rete neurale (un sistema ML modellato dal cervello) per prevedere il futuro. È stato addestrato su ore di parlato registrato per analizzare continuamente clip audio di 2 secondi e nascondere ciò che è probabile che venga dopo.

È impossibile prevedere cosa dirà la frase successiva, ad esempio se qualcuno ha appena detto: “goditi una grande festa”. Può essere attivato dalla voce di chi parla e da ciò che è stato detto in passato, che genererà rumori che interrompono il flusso delle parole.

Questo copre il passaggio successivo, che l’oratore descrive come “è in preparazione”. Gli ascoltatori umani riconoscono il rumore di fondo del camuffamento audio e possono facilmente identificare le parole pronunciate. Le macchine commettono errori.

I tassi di errore per il parlato nascosto dal rumore bianco o da un attacco competitivo competitivo erano rispettivamente del 12,8% e del 20,5%.

Anche se il framework ASR è stato programmato per tradurre il parlato interrotto da Neural Voice Camouflage, il margine di errore è rimasto invariato al 52,5%. Sebbene fossero le più facili da interrompere, parole brevi come “il” non sono gli elementi più illuminanti del dialogo.

La tecnologia è stata testata anche nella vita reale, con esperti che hanno eseguito una registrazione vocale con il camuffamento e accoppiati con un set di altoparlanti nella stessa posizione di un microfono. Era funzionale.

Mia Chiquier, un ingegnere informatico della Columbia University che ha condotto la ricerca, ha affermato che questo è solo il primo passo verso la protezione della privacy di fronte all’IA.

Chiquier afferma che la parte predittiva del programma ha molto potenziale per altri usi, come la guida di auto a guida autonoma. La previsione è anche una componente chiave della funzione cerebrale. Ti senti sorpreso quando la tua mente indovina male. Chiquier dice che stiamo replicando il modo in cui le persone fanno le cose.

Andrew Owens afferma: “Qualcosa è piacevole nel modo in cui integra la previsione del futuro, che è un problema classico nel ML, con un altro problema nel ML conflittuale”. Bo Li è rimasto stupito dalla capacità del nuovo approccio di sconfiggere i sistemi ASR fortificati.