COMPASS 2026

Libro degli Abstract

Raccolta completa dei contributi di ricerca e degli abstract dei talk per COMPASS 2026.

L'Authorship Analysis (AAn) è un compito di Natural Language Processing (NLP) che mira a inferire le caratteristiche dell'autore di un testo linguistico. Queste caratteristiche possono includere l'identità dell'autore e informazioni biografiche e sociolinguistiche, come età, genere, lingua madre e orientamento politico. L'AAn ha importanti applicazioni in settori come il patrimonio culturale, la linguistica forense e la cybersicurezza. In quest'ultimo dominio, può essere utilizzata per rilevare, scoraggiare o rintracciare attività criminali tra cui phishing, cyberbullismo e furto d'identità. Un ampio corpo di ricerca si è concentrato sull'applicazione delle tecniche di AAn alla comunicazione online, inclusi e-mail, blog, post sui social media e tweet. In particolare, l'analisi della paternità può supportare il monitoraggio di contenuti dannosi o illegali condivisi sulle piattaforme di social media e aiutare a identificare post che violano le policy delle piattaforme o le normative legali. Allo stesso tempo, l'AAn solleva significative preoccupazioni sulla privacy. La sua capacità di de-anonimizzare gli autori o collegare identità pseudonime può mettere in pericolo individui come informatori, giornalisti o attivisti politici. Di conseguenza, una crescente attenzione è stata dedicata ai metodi per modificare intenzionalmente lo stile di scrittura al fine di nascondere l'identità dell'autore e le caratteristiche personali. Questo compito, comunemente indicato come stilometria avversaria o offuscamento della paternità, cerca di ridurre l'efficacia dell'analisi stilometrica. Questo intervento fornisce una panoramica del campo, delle sue principali applicazioni e dei recenti sviluppi.

Il dibattito pubblico online non si evolve in uno spazio neutrale: la struttura delle interazioni e il contesto in cui avvengono possono plasmare in modo significativo lo sviluppo delle discussioni. Mentre alcuni ambienti amplificano la polarizzazione e il conflitto, altri favoriscono il supporto e l'empatia. Questo talk esplora queste differenze esaminando le discussioni online in ambienti informativi contrastanti, mostrando come variano i modelli di interazione e di linguaggio, e cosa rivelano queste dinamiche sull'evoluzione del discorso pubblico negli spazi digitali.

Le reti neurali a grafo (GNN) sono efficaci per la classificazione dei nodi quando le etichette possono sfruttare le informazioni dei vicini locali. Tuttavia, possono incontrare difficoltà quando la previsione dipende da interazioni a lungo raggio, a causa di problemi noti come l'oversquashing. Per affrontare questo problema, lavori precedenti hanno proposto il rewiring della topologia del grafo per migliorare la propagazione del segnale. In questo lavoro, introduciamo RAwR, un metodo di rewiring innovativo ed efficiente che crea un grafo quoziente da una partizione equa e lo connette al grafo di input. Ciò consente una comunicazione più rapida tra nodi con lo stesso ruolo strutturale (ovvero, la stessa colorazione del grafo di Weisfeiler-Leman) e riduce la resistenza effettiva totale. Inoltre, una definizione approssimata della partizione equa consente un restringimento controllabile del grafo quoziente fino a quando non collassa in un singolo nodo, recuperando così la nota tecnica di rewiring Master Node. Attraverso un ampio benchmark di valutazione, che include dataset omofili ed eterofili standard e grafi sintetici progettati specificamente per interazioni a lungo raggio, RAwR ottiene risultati all'avanguardia. Indaghiamo inoltre analiticamente i miglioramenti che RAwR può ottenere in un modello idealizzato teacher-student di GNN lineari, spiegando quando e perché il rewiring basato sul ruolo è d'aiuto. Questa intuizione teorica porta alla definizione dello Spectral Role Lift (SRL), una misura utile per identificare la partizione equa approssimata che porta alle migliori prestazioni.

L'attribuzione delle caratteristiche è il paradigma dominante per spiegare le previsioni di modelli complessi di machine learning come le reti neurali. Tuttavia, la maggior parte dei metodi esistenti offre scarse garanzie di riflettere il processo decisionale del modello. Definiamo la nozione di allineamento esplicativo e sosteniamo che sia centrale per una modellazione predittiva affidabile: in breve, richiede che le spiegazioni sottendano direttamente le previsioni anziché servire come razionalizzazioni. Presentiamo la leggibilità del modello come principio di progettazione che consente l'allineamento e le Pointwise-interpretable Networks (PiNets) come framework di modellazione per perseguirlo in un contesto di deep learning. Le PiNets combinano l'intelligenza statistica con una struttura pseudo-lineare che produce previsioni lineari per singola istanza in uno spazio di caratteristiche arbitrario. Illustriamo il loro utilizzo in compiti di classificazione e segmentazione delle immagini, dimostrando che le PiNets producono spiegazioni che non sono solo allineate per progettazione, ma anche fedeli attraverso altre dimensioni: significatività, robustezza e sufficienza.

Il talk illustra le recenti applicazioni del machine learning in finanza su cui ho lavorato negli ultimi dieci anni con i miei dottorandi: 1. L'uso di large language models per valutare il sentiment nelle notizie finanziarie, correlarlo con i rendimenti e impiegarlo in strategie di trading basate sul sentiment; 2. L'uso del reinforcement learning e del sentiment-augmented reinforcement learning nell'allocazione di portafoglio; 3. L'uso di reti neurali profonde come surrogati per velocizzare il pricing con modelli stocastici; 4. L'uso di reti neurali profonde per la calibrazione del modello, ovvero la stima forward-looking dei parametri del modello a partire dai prezzi di mercato delle opzioni europee; 5. L'uso di varie tecniche di machine learning (regressione logistica, support vector machines, reti neurali, regolarizzazione bayesiana, k-nearest neighbours, ecc.) per il credit scoring. Non tutti questi approcci funzionano ugualmente bene o hanno un vantaggio rispetto ai metodi tradizionali solo perché basati sul machine learning: il primo ha i risultati più spettacolari, il quinto i meno, il terzo e il quarto dipendono dal modello.

La presentazione sosterrà che l'ascesa delle strategie di disinformazione guidate dall'IA altera fondamentalmente il rapporto tra libertà di espressione e stato di diritto ampliando, accelerando e oscurando la comunicazione politica manipolatoria su una scala senza precedenti. Questo sviluppo sfida il ruolo classico della magistratura come garante della libera espressione, aumentando il rischio che interventi giustificati da sistemi di IA opachi possano essere usati in modo improprio in contesti di regressione democratica. In questo panorama trasformato, strumenti UE come il Digital Services Act e l'AI Act riconfigurano lo stato di diritto imponendo obblighi di trasparenza, responsabilità e mitigazione del rischio ad attori privati le cui tecnologie di IA modellano sempre più il discorso democratico.

L’avvento dell’IA, in particolare dell’IA generativa, solleva numerose preoccupazioni riguardo alla protezione degli individui più esposti ai rischi derivanti dall’uso pervasivo delle nuove tecnologie in vari aspetti della vita quotidiana. Il legislatore dell’UE ha riconosciuto queste sfide, imponendo di conseguenza il rispetto della categoria dei cosiddetti soggetti "vulnerabili". La discussione mira ad affrontare il concetto di vulnerabilità alla luce dell’AI Act, prospettando un modello di governance in cui la protezione della fragilità diventi il parametro fondamentale per la legittimità stessa dell’innovazione tecnologica.

Il panorama normativo dell’Unione Europea ha visto due tendenze diverse negli ultimi anni: dopo un’ondata di regolamenti che ci hanno lasciato l’AI Act, il Digital Services Act, il Data Governance Act, il Data Act (solo per citarne alcuni) e altri atti legislativi storici, la nuova direzione va verso la semplificazione, seguendo la narrazione che "la regolamentazione soffoca l’innovazione". Questo talk metterà in discussione questo assunto e discuterà pratiche di ricerca responsabile per favorire l’innovazione etica nel campo delle nuove tecnologie.

In un mondo pervaso dall'intelligenza artificiale, la legge deve mantenere un ruolo predominante nella salvaguardia dei diritti umani, degli interessi e della certezza del diritto. Tuttavia, è sempre più difficile per la regolamentazione tenere il passo con tecnologie in rapida evoluzione. Una questione chiave riguarda l'interpretazione dell'AI Act, in particolare l'articolo 5(1)(a), che vieta i sistemi di IA che utilizzano tecniche manipolatorie, ingannevoli o subliminali che causano danni significativi. Tuttavia, la nozione di "danno significativo" non è definita, lasciando agli interpreti il compito di determinarne il significato e aumentando la discrezionalità e l'incertezza del diritto. In un contesto altamente tecnologico, è quindi cruciale identificare la soglia oltre la quale il danno diventa significativo, al fine di prevenire situazioni pregiudizievoli e ambiguità nell'applicazione. Ciò richiede l'analisi della legislazione europea sul danno, le sue sottocategorie e concetti correlati come la gravità e la violazione legale. Un caso di studio interessante è quello degli assistenti virtuali basati sulla voce, che utilizzano tecniche NLP e API per fornire risposte tempestive agli utenti. In che modo questi sistemi potrebbero manipolare o ingannare gli utenti e portare a scelte inconsapevoli? E a quali condizioni tale condotta potrebbe causare un danno significativo? Questa analisi mira a identificare quando tali comportamenti equivalgono a manipolazione, inganno o influenza subliminale, fornendo orientamenti sia ex ante per gli sviluppatori che ex post per gli utenti interessati.

Che tipo di agire e, di conseguenza, di responsabilità sorge nel contesto dei sistemi di intelligenza artificiale? Da un lato, un sistema di intelligenza artificiale appare capace di un "agire senza azione" – cioè senza un soggetto – che emerge proprio nel nostro rapporto con il sistema stesso. Ciò richiederebbe un regime di responsabilità morale diverso da quello della colpa tout court. Piuttosto, partendo dal riconoscimento delle vulnerabilità degli agenti coinvolti, sembrerebbe sorgere una sorta di responsabilità dinamicamente negoziata. D’altro canto, ciò appare in linea con l’orientamento giuridico più generale, che tende verso la responsabilità senza colpa, o responsabilità oggettiva. Mettendo da parte le sfumature dottrinali, potrebbe esserci una corrispondenza tra i due domini, quello etico e quello legale. Un tale approccio, che verrà descritto durante l’intervento, potrebbe rendere giustizia alle soluzioni già proposte, come la registrazione delle interazioni prevista dall’AI Act dell’UE.

L’innovazione emerge da modelli di collaborazione complessi - tra inventori, aziende o istituzioni. Tuttavia, non si sa molto sulla struttura mesoscopica complessiva attorno alla quale si auto-organizza l’attività inventiva. In questo studio, affrontiamo il problema utilizzando i dati sui brevetti per analizzare sia le reti individuali (co-inventorship) che quelle organizzative (co-ownership) in tre domini strategici (intelligenza artificiale, biotecnologia e semiconduttori). Caratterizziamo la struttura a mesoscala (in termini di cluster) di ogni dominio confrontando due metodi alternativi: una baseline standard - la massimizzazione della modularità - e uno basato sulla minimizzazione del Bayesian Information Criterion, all’interno dello Stochastic Block Model e della sua variante corretta per il grado. Troviamo che, in tutti i settori, le reti degli inventori sono più dense e più raggruppate di quelle delle organizzazioni - coerentemente con la presenza di piccoli team ricorrenti inseriti in gerarchie istituzionali più ampie - mentre le reti delle organizzazioni hanno strutture basate sui ruoli gerarchici più nitide, con poche aziende di collegamento che coordinano quelle più periferiche. Troviamo inoltre che le meso-strutture scoperte sono collegate all’output dell’innovazione. In particolare, le curve di Lorenz delle citazioni future mostrano una disuguaglianza pervasiva nell’influenza tecnologica: in tutti i settori e metodi, sia le reti degli inventori (specialmente) che quelle delle organizzazioni mostrano costantemente alti livelli di concentrazione di citazioni in alcuni dei cluster scoperti. I nostri risultati dimostrano che il metodo basato sulla modularità di base potrebbe non essere in grado di catturare appieno il modo in cui le collaborazioni guidano la diffusione dell’impatto inventivo attraverso i domini tecnologici. Ciò è dovuto alla presenza di gerarchie locali che richiedono strumenti più raffinati basati sull’inferenza bayesiana.

Questo lavoro indaga l'integrazione tra topologia delle reti e machine learning per la previsione del rischio sistemico nei mercati azionari. Utilizzando i rendimenti giornalieri dei componenti dello S&P 500, costruiamo reti di correlazione dinamiche per estrarre feature topologiche ad alta dimensione, inclusi parametri basati sugli autovalori (absorption ratio, network entropy) e centralità teoriche dei grafi. Valutiamo una suite comparativa di architetture predittive — dai Gradient Boosted Decision Trees alle Graph Neural Networks (GraphSAGE, GAT) e LSTM — validate tramite walk-forward cross-validation con purging. I risultati dimostrano che la topologia della rete manifesta anomalie statisticamente significative con una media di 67 giorni di anticipo rispetto all'inizio delle crisi, con un'analisi lead-lag che conferma la causalità predittiva rispetto alle misure tradizionali di volatilità implicita (VIX). Infine, esaminiamo la microstruttura del mercato attraverso il comportamento di herding (framework CCK) e gli spillover di volatilità (metodologia Diebold-Yilmaz), traducendo questi segnali in strategie di trading economicamente significative come il probability scaling in stile Kelly.

Il network embedding è una tecnica fondamentale per proiettare una rete in uno spazio a dimensione inferiore preservando le similarità tra i nodi. I network embedding tradizionali catturano principalmente la prossimità dei nodi, risultando efficaci per la community detection ma insufficienti per identificare i ruoli, ovvero i pattern di interazione oltre i vicinati locali. Per superare questo limite, introduciamo una tecnica di embedding semplice ed efficiente basata su varianti approssimate di partizioni eque. Il nostro approccio, chiamato ε-BE, introduce un parametro di tolleranza regolabile dall'utente che rilassa la condizione altrimenti rigorosa per le partizioni eque esatte, difficilmente riscontrabili nelle reti del mondo reale. Sfruttiamo una relazione tra partizioni eque e relazioni di equivalenza per catene di Markov ed equazioni differenziali ordinarie per sviluppare un algoritmo di raffinamento della partizione per calcolare una partizione equa approssimata in tempo polinomiale. Estendiamo questo framework a reti pesate e dirette, garantendo l'applicabilità a una classe più generale di grafi e colmando una lacuna nella letteratura dove sono presenti pochi approcci. Confrontiamo il nostro metodo con tecniche di embedding allo stato dell'arte su reti sintetiche e del mondo reale. Riportiamo prestazioni comparabili, se non superiori, per task di visualizzazione, classificazione, clustering e regressione con tempi di esecuzione ridotti, consentendo l'embedding di reti su larga scala che non potrebbero essere gestite efficientemente dalla maggior parte delle tecniche concorrenti. Questi risultati e la capacità di gestire reti pesate e dirette rendono il nostro approccio una valida alternativa per lo structural network embedding.

Le reti bipartite forniscono una visione fondamentale dell’organizzazione dei sistemi complessi del mondo reale. Una sfida chiave nella modellazione di questi sistemi è l’ideazione di una proiezione monopartitica che preservi le intricate informazioni codificate all’interno della struttura bipartita originale. Proponiamo un algoritmo non supervisionato per ottenere proiezioni statisticamente validate di reti bipartite signed, secondo cui due nodi che condividono un numero statisticamente significativo di motivi concordanti (discordanti) sono collegati da un arco positivo (negativo). Valutando la significatività statistica attraverso quattro distinti Exponential Random Graph Models (ERGM), generiamo p-value specifici per i collegamenti filtrati tramite correzione per test multipli. Dopo aver convalidato il metodo su configurazioni sintetiche da un modello generativo completamente controllabile, lo applichiamo a tre reti sociali del mondo reale. In tutti i casi, l’algoritmo rileva strutture mesoscopiche non banali che non possono essere spiegate dai vincoli dei modelli nulli, svelando così l’autentica complessità signed del sistema sottostante. Infine, mostriamo come la flessibilità intrinseca del nostro framework consenta facili estensioni a modelli nulli più sofisticati e a diversi sistemi complessi.