Progressi nell'Analisi della Paternità e nella Stilometria Avversaria
L'Authorship Analysis (AAn) è un compito di Natural Language Processing (NLP) che mira a inferire le caratteristiche dell'autore di un testo linguistico. Queste caratteristiche possono includere l'identità dell'autore e informazioni biografiche e sociolinguistiche, come età, genere, lingua madre e orientamento politico. L'AAn ha importanti applicazioni in settori come il patrimonio culturale, la linguistica forense e la cybersicurezza. In quest'ultimo dominio, può essere utilizzata per rilevare, scoraggiare o rintracciare attività criminali tra cui phishing, cyberbullismo e furto d'identità.
Un ampio corpo di ricerca si è concentrato sull'applicazione delle tecniche di AAn alla comunicazione online, inclusi e-mail, blog, post sui social media e tweet. In particolare, l'analisi della paternità può supportare il monitoraggio di contenuti dannosi o illegali condivisi sulle piattaforme di social media e aiutare a identificare post che violano le policy delle piattaforme o le normative legali.
Allo stesso tempo, l'AAn solleva significative preoccupazioni sulla privacy. La sua capacità di de-anonimizzare gli autori o collegare identità pseudonime può mettere in pericolo individui come informatori, giornalisti o attivisti politici. Di conseguenza, una crescente attenzione è stata dedicata ai metodi per modificare intenzionalmente lo stile di scrittura al fine di nascondere l'identità dell'autore e le caratteristiche personali. Questo compito, comunemente indicato come stilometria avversaria o offuscamento della paternità, cerca di ridurre l'efficacia dell'analisi stilometrica. Questo intervento fornisce una panoramica del campo, delle sue principali applicazioni e dei recenti sviluppi.