Read in English

Credit: Fly View Productions/ E+/ Getty Images.

Le recenti crisi bancarie evidenziano la necessità di nuovi e migliori strumenti per monitorare e gestire il rischio finanziario, e l'intelligenza artificiale (IA) può essere parte della risposta. L'adozione dell'IA nel settore finanziario e bancario è da tempo oggetto di discussione.

Nel 2017, la banca J.P. Morgan ha presentato il primo software basato sull'IA per l'elaborazione di documenti finanziari, chiamato COIN (COntratc Intelligence). Qualche anno dopo, l'Organizzazione per la Cooperazione e lo Sviluppo Economico (OCSE) ha aperto l'Osservatorio AI sul Fintech (AIFinanceOECD 2021) concentrandosi su opportunità e rischi. Anche l'Europa e l'Italia si sono mosse in questa direzione e una delle 11 priorità italiane del Programma Strategico Nazionale sull'Intelligenza Artificiale, lanciato nel novembre 2021, è proprio l'AI per il settore bancario, finanziario e assicurativo. Questo è anche un tema del nuovo grande progetto di ricerca nazionale sull'IA chiamato FAIR.

L'IA sta influenzando la finanza in diversi modi. I modelli di deep learning possono essere utilizzati per migliorare l’interazione tra i clienti e le piattaforme digitali, per l’identificazione biometrica dei clienti, per i chatbot o altre applicazioni basate sull'IA che migliorano l'esperienza degli utenti. L'apprendimento automatico è stato spesso applicato con successo anche all'analisi delle serie temporali finanziarie per l'analisi macroeconomica1, o per la previsione dell’andamento delle borse, grazie al grande volume di dati disponibili sugli scambi.

Tuttavia, l'uso del deep learning per l'analisi dei dati sulle transazioni bancarie è ancora poco esplorato. Questi dati rappresentano la più grande fonte di informazioni per le banche, perché consentono di profilare i clienti, le frodi e fare previsioni dinamiche che possono aiutare a prevenire la perdita di clienti. Tuttavia, la natura dei dati e la mancanza di grandi set di dati pubblici annotati (per motivi di privacy e commerciali) rendono i dati transazionali estremamente difficili da gestire per gli attuali modelli di intelligenza artificiale.

Questi "modelli fondazionali", inizialmente sviluppati per l'elaborazione del linguaggio naturale, sono grandi architetture di reti neurali artificiali pre-addestrate su enormi quantità di dati, come i documenti di Wikipedia o miliardi di immagini raccolte sul web. Possono essere utilizzati in modo semplice, come mostra il successo mondiale di Chat-GPT, o adattati a compiti specifici. Ma è più complesso ridefinire la loro architettura per tipi di dati completamente diversi, come i dati bancari transazionali. Questi dati sono multimodali, cioè possono includere informazioni numeriche (l'importo della transazione), categoriche (il tipo), testuali (la descrizione del bonifico) e in alcuni casi hanno una struttura specifica (la data). La struttura cambia a seconda del tipo di transazione (pagamento con carta, prelievo da ATM, addebito diretto o bonifico). Esistono importanti correlazioni all'interno di una serie di transazioni, ad esempio nei pagamenti periodici, e tra serie diverse, perché ogni cliente può possedere diversi prodotti bancari, diversi conti, e alcuni conti hanno diversi proprietari. Infine, alcune transazioni sono correlate a condizioni esterne non conoscibili a priori, come le vacanze o il blocco nel periodo della pandemia.

Il nuovo progetto italiano UniTTab, una collaborazione di ricerca tra il gruppo di ricerca economica indipendente Associazione Prometeia e l'Università di Modena e Reggio Emilia, sta cercando di superare queste difficoltà ed esplorare l'uso del deep learning per i dati bancari transazionali. Il progetto si basa su un ampio set di dati forniti da un'importante banca italiana, con circa 1,5 miliardi di transazioni riferite a circa tre milioni di clienti anonimizzati, che vanno dal 2020 al 2022. Fondamentale è anche la disponibilità di grandi strutture di calcolo basate su GPU (Graphic Processing Units) e di nuovi modelli architetturali neurali, progettati specificamente per i dati transazionali bancari.

Il progetto ha ottenuto risultati preliminari nella creazione di un nuovo modello di base per la finanza2, basato su un'evoluzione dell'architettura "Transformer" utilizzata da BERT, GPT e molti altri modelli. L'intelligenza artificiale riceve in ingresso sequenze di transazioni bancarie e trasforma i diversi formati di dati numerici, testuali e categorici in una rappresentazione uniforme. Poi impara in modo auto-supervisionato a ricostruire le sequenze iniziali, analogamente a quanto fa GPT con il testo. Ciò consente di eseguire molte operazioni su nuove serie di transazioni, diverse dall'insieme di addestramento originale.

Il modello è in grado di classificare il comportamento dei clienti, rilevare anomalie e frodi, prevedere il churn rate (i clienti che lasciano la banca) nei mesi successivi. Questi dati potrebbero anche essere utilizzati per generare nuove serie di transazioni molto simili a quelle originali, ma non esattamente uguali, creando un set di dati sintetico di transazioni che potrebbe essere utilizzato per le analisi, al tempo stesso preservando la privacy dei clienti.

Dopo l'addestramento sul dataset fornito all'Associazione Prometeia, l'efficacia del modello è stata testata in un compito di rilevamento delle frodi su un dataset di circa 450.000 transazioni sintetiche con carta. I risultati sono ottimi e superano qualsiasi concorrente, con un'accuratezza del 95,5%. Un altro compito di previsione dell'insolvenza dei prestiti è stato testato su un dataset open-source e ha ottenuto un'accuratezza del 94,5%. Un compito di previsione del tasso di abbandono è stato testato su una versione diversa del dataset originale di Prometeia e i risultati sono stati confrontati con l'annotazione reale dei conti chiusi nel 2022. La previsione è risultata molto precisa e migliore rispetto ai concorrenti, con un'accuratezza del 90,8%.

L'architettura è solo un primo prototipo, ma il progetto dimostra la possibilità di progettare modelli di intelligenza artificiale specifici per il settore finanziario.