Courtesy Fondazione Bracco, credits Gerald Bruneau

Tiziana Catarci: la signora dell’agoritmo

Essere definita “la signora dell’algoritmo” non le dispiace affatto. Del resto Tiziana Catarci, che alla Sapienza di Roma dirige il Dipartimento di Ingegneria informatica, automatica e gestionale, dal 1986 si occupa, tra attività di ricerca e didattica, di numeri, dati, processi computazionali.

“L’algoritmo è il processo logico che porta alla risoluzione dei problemi, è la traduzione del pensiero computazionale, e il pensiero computazionale è alla base dell’informatica, quindi anche l’algoritmo è alla base dell’informatica e dell’ingegneria informatica”.

E oggi, in una società sempre più digitalizzata e sempre più complessa, competenze informatiche e capacità di pensiero critico non possono mancare nella nostra cassetta degli attrezzi: sono la chiave per affrontare le sfide del cambiamento. Tiziana Catarci ne è convinta. Perché in fondo, come ha sottolineato anche Jeannette Wing, direttrice del Dipartimento di Informatica della Carnegie Mellon University, l’informatica non ha solo portato allo sviluppo di computer, smartphone ecc., ma ha introdotto anche innovazione nel modo di pensare. E così, la diffusione della tecnologia deve favorire anche la diffusione del pensiero computazionale: un approccio logico alla soluzione dei problemi.

Tiziana Catarci è entusiasta e appassionata di ciò che studia e insegna, dentro e fuori le aule universitarie, perché  tante sono le attività in cui è coinvolta per avvicinare i giovanissimi, e in particolare le giovanissime, all’informatica e al coding. E parlando con lei, dall’importanza del pensiero computazionale al ruolo strategico della computazione per analizzare enormi quantità di dati il passo è breve.

“I dati sono il nuovo petrolio. Sono una risorsa importantissima. Sui dati infatti si basa larga parte della ricerca e il funzionamento del machine learning. Parliamo cioè di algoritmi intelligenti che apprendono dai dati. E sui dati, o meglio sul data analytics, si basano sempre più le strategie decisionali di successo, perché l’analisi avanzata dei dati consente di generare nuova conoscenza, ricavare informazioni ed estrarre valore da grandi volumi di dati”.

Già, il potere dei dati.

Basti pensare a società come Google o Facebook che hanno costruito la loro fortuna e il loro successo sull’analisi dei dati.

Ormai è chiaro anche ai non addetti ai lavori quanto siano importanti i dati. Del resto, proprio nella gestione dell’emergenza Covid è emerso quanto i dati siano preziosi per poter monitorare realmente e gestire al meglio la situazione. Ma, come rivendicato a gran voce dalla campagna #datibenecomune per esempio, servono dati completi, accurati, pubblici, condivisibili, accessibili. Ma professoressa ci aiuti a fare chiarezza: cosa sono i dati?

Ci sono tipi diversi di dati. Ci sono i dati strutturati, quelli raccolti nelle basi di dati, e ci sono quelli che vengono generati in continuazione in rete: si pensi alle transazioni elettroniche, a quelli generati dai sensori, dagli oggetti smart, ai dati che noi generiamo continuamente facendo acquisti con la carta di credito, navigando di sito in sito. 

Francamente, fa sorridere che siano state sollevate tante polemiche per violazione della privacy sull’app Immuni, trascurando il fatto che non facciamo altro che cedere dati quando usiamo lo smartphone, la carta credito, quando condividiamo foto…

Sul fronte della cybersicurezza manca consapevolezza, manca l’alfabetizzazione e oscilliamo tra un approccio maniacale e una estrema disinvoltura con cui clicchiamo su un link senza pensarci.

App Immuni a parte, in Italia si fa un buon uso dei dati? L’Italia, cioè, ha investito sulla trasformazione digitale?

No. L’Italia purtroppo è molto indietro su aspetti basilari, mi riferisco alle infrastrutture, ma non solo. Si pensi alla digitalizzazione dei processi. Possiamo realizzare il più meraviglioso sistema dematerializzato, ma se esiste una legge che prevede che poi quel documento debba essere depositato in forma cartacea dal notaio o alla biblioteca!!!

E poi c’è la questione annosa della data-integration, dell’interoperabilità delle banche dati. Provo a spiegarmi. Partiamo dal presupposto che aziende ed enti hanno dati, preziosi, utili, fondamentali per il loro stesso funzionamento: perché i dati, in altre parole, sono il cuore dell’organizzazione.

Ma uno dei grandi problemi in Italia, relativamente ai dati strutturati, è che ogni organizzazione ha i suoi dati – per esempio, dati relativi ai cittadini, a progetti, leggi, eventi – e li tiene nei silos, in sistemi chiusi. Questo significa che i dati non si possono integrare e l’integrazione dei dati è il primo passo, necessario, per compiere una piena trasformazione digitale, per avere un’Italia digitale.

In altre parole, parliamo tanto di dati, sosteniamo, giustamente, che devono essere aperti ma in Italia sono ancora confinati nei silos, non sono condivisi. 

Con tutto ciò che ne consegue. Banalmente per esempio, un’inutile perdita di tempo per portare a termine operazioni che si potrebbero risolvere con un semplice clic?

Banalmente, è difficile sapere se lo studente Mario Rossi iscritto al corso di laurea in veterinaria è lo stesso Mario Rossi residente nel comune di Roccasecca. Questo è il primo ostacolo alla trasformazione digitale.

Immaginiamo che negli anni il Comune di Roccasecca abbia censito i suoi abitanti adottando un suo schema, creando un suo codice.

Immaginiamo che anche l’università, un qualsiasi ateneo italiano, abbia realizzato la sua banca dati usando la matricola come codice, e abbia collezionato ulteriori informazioni: non solo dati anagrafici, ma conoscenza dell’inglese, sport praticati…

A questo punto immaginiamo che il Ministero dell’Istruzione voglia fare un’anagrafe integrata di tutti gli studenti e le studentesse. Ebbene, voi direte: ci sono i dati dei Comuni e quelli delle università, quindi con questi dati è possibile popolare l’anagrafe ministeriale. E invece no. Perché i dati sono chiusi in scatola.

Per cui per popolare l’anagrafe degli studenti bisogna partire da zero: in altre parole, se non so come sono organizzate le banche dati di Comuni e atenei, se non ne conosco lo schema, di fatto non ho modo di sapere se Mario Rossi che risiede a Roccasecca è lo stesso Mario Rossi iscritto all’università.

In altre parole, in assenza di elementi per confrontare i dati, è necessario chiederli un’altra volta e questa duplicazione di informazione è sorgente di errori – perchè ogni interrogazione può essere accompagnata da errori nell’inserimento, da errori umani – oltre che di ridondanza di dati e ostacola la possibilità di costruire applicazioni integrate, procedure che automaticamente consentono di identificare, per esempio, gli studenti meritevoli residenti in comuni terremotati cui assegnare una borsa studio.

E tutto questo comporta anche un cattivo servizio per l’utente Mario Rossi che, per la terza volta, viene interrogato per fornire le stesse informazioni…

È un esempio banale, molto semplificato, ma utile per riflettere sui problemi enormi connessi alla mancanza di data-integration.

Immagino appunto, per fare un altro esempio, che la lotta all’evasione fiscale potrebbe trarre beneficio dall’integrazione delle basi dati.

Certo, il software può identificare gli evasori: qualcosa è iniziato, ma si può fare molto di più

Insomma, la gestione e la disponibilità dei dati costituisce oggi un tema cruciale e strategico. Se l’Italia è indietro sulla digitalizzazione, che fare per accelerare?

È fondamentale reingegnerizzare i processi in modo che siano digitalizzati efficacemente. Perseguire la data-integration e l’interoperabilità delle banche dati. Puntare sugli open data: avere dati aperti significa poter accedere ai dati ed estrarre valore da essi.

Ovviamente servono infrastrutture tecnologiche. Ma è più difficile fare data-integration che realizzare infrastrutture.

Nodo cruciale anche quello delle competenze. Mancano le competenze digitali.

Mancano in tutto il mondo. Da noi di più. A livello globale mancano milioni di persone altamente qualificate nel digitale: informatici, ingegneri informatici, data scientist… 

In Italia però manca anche l’alfabetizzazione di base, che è diversa dalla competenza. Ci vorrebbe il maestro Manzi del digitale e bisognerebbe introdurre nelle scuole l’insegnamento del pensiero computazionale. Senza trascurare le competenze specifiche, bisognerebbe valorizzare la multidisciplinarietà e un punto fondamentale da non sottovalutare è la valorizzazione delle competenze femminili in questo settore. In Italia, come in buona parte dei paesi occidentali, mancano donne nel settore ICT e sono ancora poche le ragazze che intraprendono percorsi formativi in quest’ambito. In linea con Europa e Usa, non arriviamo al 20% tra gli iscritti ai corsi di laurea in ingegneria, informatica… 

E questo è un grosso problema, perché la diversità è un valore e non avere un bilanciamento di genere, così come non avere un bilanciamento di etnia, tra le professioni che stanno cambiando il mondo, è grave. In questi settori riscontriamo ancora una predominanza di uomini bianchi e questo vuol dire che il futuro lo stanno disegnando loro.

Equità, diversità e mancanza di pregiudizi sono dunque valori da difendere e obiettivi da raggiungere anche nel campo dell’Intelligenza artificiale. E lei è impegnata in prima linea su questo fronte. Da anni promuove la diffusione della cultura STEM tra le bambine e le ragazze. Fa parte del Management Committee della COST Action “European Network for Gender Balance in Informatics”. È considerata una role model, un modello di riferimento per chi ambisce a lavorare nel campo della tecnologia. E non perde occasione per sottolineare che non si può fare la rivoluzione digitale senza un ruolo attivo delle donne.

Assolutamente sì. La mancanza di donne nel settore cosiddetto STEM ha un costo economico e sociale molto alto. E più donne impegnate nell’ICT significa benefici per tutto il paese, perché ormai è assodato quanto la diversità sia un fattore fondamentale. Dove c’è diversità c’è più successo e maggiore benessere.

E non trascuriamo poi che avere competenze digitali oggi è fondamentale per affrontare con successo il mondo del lavoro: le nostre lauree non conoscono la disoccupazione. La Commissione europea stima una carenza in Europa di circa un milione di lavoratori nel settore ICT.

Dunque, da un lato siamo in enorme carenza di figure professionali specializzate nel digitale, dall’altro i dati Istat confermano una grande disoccupazione giovanile e in particolare femminile, anche a causa della pandemia.

Questi due dati dovrebbero bastare per incoraggiare lo studio di queste materie.

Insomma, formare data scientist è una sorta di imperativo per le nostre università. Anche perché l’intelligenza artificiale promette di rivoluzionare trasversalmente la società: dai trasporti, alle città, agli ospedali. Basti pensare all’ingresso in ambito clinico dei big data e del machine learning che accelerano il passaggio verso una medicina sempre più di precisione.

Sicuramente dobbiamo formare data scientist, ingegneri informatici e informatici, ma dobbiamo anche formare competenze multidisciplinari in discipline diverse, dall’archeologia all’architettura, dalla giurisprudenza alla medicina: formare cioè figure ibridate con competenze digitali.

Mi spiego meglio.

In ospedale, con l’ingresso appunto dell’intelligenza artificiale e dei big data, nascono team multidisciplinari, ma il medico che lavora gomito a gomito con il data scientist e il bioingegnere non smette di essere medico e di visitare i pazienti, deve però essere in grado di interfacciarsi con il mondo dei dati. 

Proprio per questo alla Sapienza da quest’anno abbiamo lanciato una laurea in medicina hi-tech per formare medici 4.0: ci si laurea in medicina, ma si acquisiscono competenze di base ingegneristiche e informatiche per poter lavorare a una nuova medicina.

Una nuova medicina, la cosiddetta Digital Health, che sta entrando negli ospedali e promette di rivoluzionare la gestione della salute. E che è entrata nell’Enciclopedia Treccani, nella X Appendice dedicata alle nuove parole del XXI secolo, dove è definita come l’insieme di tecnologie dell’informazione e della comunicazione che contribuiscono a gestire le malattie e i rischi per la salute, nonché a promuovere la salute e il benessere. 

Vorrei ribadire che in questo nuovo scenario il medico non smette di visitare gli ammalati ma ha delle competenze e degli strumenti in più. Può utilizzare cioè la conoscenza dei dati per migliorare le diagnosi e gli approcci terapeutici. Insomma, gli algoritmi intelligenti non sostituiscono il medico ma entrano tra i suoi ferri del mestiere, diventano appunto strumenti preziosi a servizio della salute.

A proposito di interazione umano-macchina e dell’enorme aumento della potenza di calcolo e della disponibilità di dati che sono alla base del machine learning, i nuovi scenari definiti dall’evoluzione tecnologica ci pongono di fronte a nuove questioni etiche?

Parlando di evoluzione tecnologica e di Human-Computer Interaction, l’interazione di base da venti anni a oggi non è cambiata poi molto. Da quando cioè è stato introdotto il paradigma dell’interfaccia a finestre, l’interazione è migliorata, è diventata più efficace ed efficiente, ma in sostanza non è cambiata. Oggi stiamo assistendo a una maggiore pervasività della realtà aumentata e della realtà virtuale perchè trent’anni fa non avevamo una tecnologia tale da consentirne una piena diffusione.

Inoltre siamo sempre più immersi in ambienti intelligenti, dove l’interazione è più pervasiva: siamo contornati cioè da oggetti intelligenti, interattivi e proattivi…

Ma, detto questo, non ci sono stati cambiamenti radicali nel campo dell’Human-Computer-Interaction. Sicuramente ci sono stati dei miglioramenti, ma non delle rivoluzioni paragonabili alla diffusione del web, di internet.

Detto questo è innegabile che in un mondo sempre più digitale sia importante una nuova etica. È importante riflettere sull’impatto della digitalizzazione sulla società e sul processo di tecnosimbiosi?

Assolutamente sì. L’etica è fondamentale. Proprio per questo in Italia abbiamo dato vita a SIpEIA, la Società italiana per l’etica dell’Intelligenza artificiale. È un’associazione accademica che riunisce docenti, ricercatori e ricercatrici, informatici, filosofi, giuristi, per confrontarci sui problemi etici sollevati dall’Intelligenza Artificiale.

Del resto, l’importanza dell’etica è risultata evidente fin da quando si è cominciato a usare i sistemi di machine learning, modalità in base alla quale un sistema apprende dagli esempi. Perché se gli algoritmi intelligenti imparano da quello che trovano, non possiamo sottovalutare cosa trovano. Perché se i dati su cui l’algoritmo apprende contengono pregiudizi, l’algoritmo impara da questi pregiudizi.

A questo in fondo si riferisce la nota espressione Garbage in – Garbage out. Insomma, se i dati sono inquinati da pregiudizi, la decisione elaborata dal sistema di machine learning non potrà che riflettere tali pregiudizi.

Sì e gli esempi che lo confermano sono molti. Tanto che diversi algoritmi sono stati ritirati: per esempio quello di Amazon usato per le assunzioni dei manager. Imparando dai dati storici relativi ai curricula dei manager assunti (80% uomini), perpetuava la scelta pregiudiziale scartando i CV delle donne. Altro caso famoso quello dell’algoritmo adottato negli Stati Uniti per concedere la libertà vigilata, le cui scelte erano inficiate dal bias etnico. 

Cercare dunque di eliminare i bias, far sì che il sistema non si nutra di biased data è fondamentale.

Altra questione etica a mio avviso cruciale è incentrare effettivamente la tecnologia sull’essere umano 

Cioè?

Il progresso deve essere funzionale al miglioramento sociale, alla salvaguardia dei valori sociali, ambientali, educativi. In questo senso si parla di AI for good e in questa direzione stanno portando avanti iniziative sia l’Unione europea sia l’ONU. L’intento è dare un’impostazione etica allo sviluppo tecnologico affinché non vengano amplificate storture e disuguaglianze e il progresso sia effettivamente a servizio dell’essere umano.

Tecnovisionarie

“DONNE SCIENZA INVENZIONE CARRIERA – Progetto di Gianna Martinengo”

Dalle esperienze alle skill al role model, viaggio tra le professioniste e scienziate che stanno facendo progredire il mondo della scienza italiano e internazionale. Interviste a “mente aperta” anticipate da un viaggio nei diversi mercati dell’innovazione. Uno spazio sarà dedicato alle trentenni , giovani donne – professioniste e scienziate – che affrontano il futuro con coraggio e determinazione.

Condividi questa pagina