DATA SCIENCE

Identificativo : 
30101
Tipo offerta formativa : 
Dottorato
Anno accademico : 
2018/2019
Posti : 
5
Numero di borse : 
4
Numero di borse finanziate da enti : 
0
Numero di borse finanziate da consorzi : 
0

Obiettivi formativi

La Data Science è un campo di studi interdisciplinare che si è affermato negli ultimi anni al fine di offrire gli strumenti metodologici e le tecnologie necessarie per la gestione e l’analisi dei big data e la loro valorizzazione nell’industria, nei servizi, e nella ricerca. Il fenomeno dei dei big data ha rivoluzionato innumerevoli settori di attività economico-sociale. Il fenomeno dei big data ha anche modificato profondamente le metodologie di ricerca e lo sviluppo dell'innovazione tecnologica in numerose discipline e applicazioni. L'obiettivo principale di questo Dottorato di Ricerca è la realizzazione di progetti di ricerca interdisciplinari di Data Science che portino allo sviluppo di metodologie e tecnologie innovative basate sull'uso dei big data nei seguenti campi di applicazione: i) Piattaforme digitali avanzate, ii) Gestione degli spazi urbani e delle risorse ambientali iii) Medicina e salute iv) Analisi Economica e Sociale. La Data Science riceve il contributo determinante dell’informatica, della Statistica, dell’ingegneria, della matematica applicata, e delle discipline accademiche che aiutano a comprendere l’impatto dei big data nelle applicazioni. Tali competenze sono rappresentate estesamente nei Settori Scientifici Disciplinari che compongono il Collegio di Dottorato, sia con riferimento alle competenze core della Data Science che alle applicazioni sopra indicate. I) Per le competenze relative alla statistica, alla matematica applicata, e alle applicazioni economico-sociali sono presenti componenti dei seguenti SSD: SECS-S/01 - STATISTICA Il settore comprende l’attività scientifica e didattico-formativa nell’ambito di ricerca dell’analisi dei dati, del disegno e della realizzazione di indagini ed esperimenti nei diversi settori applicativi, a fini descrittivi, interpretativi e decisionali. Include quindi gli sviluppi teorici e applicativi propri della statistica descrittiva, esplorativa, inferenziale e decisionale nelle loro diverse articolazioni quali: la statistica matematica, il disegno e l’analisi di indagini, la teoria dei campioni, il piano degli esperimenti, l’analisi dei dati multivariati, l’analisi delle serie temporali e spaziali, l’affidabilità e il controllo statistico della qualità, la biostatistica, la statistica medica e la statistica ambientale. Di tali sviluppi sono parte integrante la statistica computazionale, lo sviluppo di software per l’analisi statistica, le moderne problematiche della gestione ed elaborazione informatica di grandi moli di dati (big data) e le applicazioni della metodologia sia a dati di osservazione che sperimentali. SECS-S/06 - METODI MATEMATICI DELL'ECONOMIA E DELLE SCIENZE ATTUARIALI E FINANZIARIE Il settore affronta le problematiche relative all'individuazione ed allo sviluppo di metodi e strumenti matematici per la costruzione e l'analisi di modelli e problemi della gestione aziendale; della finanza; delle scienze attuariali; delle scelte individuali, strategiche e collettive; dell'analisi dei mercati; della gestione del rischio e più in generale delle scienze economiche e sociali. Si tratta di realtà complesse, la cui lettura può essere resa possibile solo mediante un’accurata raccolta ed interpretazione dei dati relativi ad esse. Il settore quindi include esplicitamente il lavoro di ricerca ed insegnamento delle tecniche di calcolo e di elaborazione dei dati. Il ruolo dei dati è così centrale che non solo sono stati sviluppati metodi e modelli per comprendere la realtà economica mediante i dati, ma è sempre più importante nel settore la creazione e lo sviluppo di modelli, anche teorici, che siano efficienti dal punto di vista computazionale e che siano in grado di fornire risposte rapide e corrette a fenomeni di difficile analisi. MAT/06 PROBABILITÀ E STATISTICA MATEMATICA Il settore include competenze e ambiti di ricerca relativi allo studio, dal punto di vista sia teorico sia applicativo, del calcolo delle probabilità delle tecniche stocastiche a esso connesse e della statistica matematica. Studia altresì gli aspetti stocastici delle teorie dell'affidabilità, delle code, delle decisioni e dei giochi. In questi ambiti si inseriscono, tra gli altri, i seguenti temi: analisi stocastica degli algoritmi, teoria matematica dei giochi e studio di algoritmi di apprendimento per il calcolo dei loro equilibri, studio di decisioni ottime sotto incertezza in contesto statico e dinamico, analisi di reti stocastiche e file d’attesa, studio di trasmissione d’informazione su reti, sviluppo di metodi matematici per l’analisi di dati complessi e di grandi dimensioni. II) Per le competenze relative all'Informatica, l'Ingegneria dell'Informazione, la Bioingegneria e le applicazioni nel campo delle piattaforme digitali avanzate, sono presenti componenti dei seguenti SSD: INF/01 - INFORMATICA Il settore si interessa all'attività scientifica e didattico-formativa nel campo dell'Informatica. I contenuti caratterizzanti riguardano la logica e i modelli computazionali, la teoria della calcolabilità e della complessità, il progetto e l'analisi di algoritmi, la teoria dell'informazione, la teoria dei codici e la crittografia, i linguaggi e le metodologie di programmazione. Nell'ambito dell'Informatica rientrano un ampio spettro di argomenti, fra cui i sistemi operativi, il progetto e l'amministrazione dei sistemi informatici, la sicurezza dei sistemi informatici, le basi di dati, l'ingegneria del software, l'intelligenza artificiale, le reti neurali, il recupero delle informazioni, l'apprendimento automatico, i sistemi per l'interazione uomo-macchina, l'elaborazione del linguaggio naturale, la computer grafica, le reti informatiche, l'analisi e la sicurezza delle reti, i sistemi distribuiti. L'approccio della disciplina è orientato all'analisi e alla soluzione di problemi, con particolare riguardo all'efficienza, all'affidabilità e alla sicurezza delle soluzioni. ING-INF/03 - TELECOMUNICAZIONI. La disciplina si occupa della progettazione delle future reti di telecomunicazione, che avranno lo scopo di fornire una piattaforma comune in grado di abilitare vari servizi diversi: guida autonoma delle autovetture, realtà virtuale/aumentata, tele-medicina, Industry 4.0, ecc. Un gran numero di questi percorsi di ricerca, possono trovare il loro ambiente naturale nel Dottorato di Ricerca in Data Science: a) analisi dei big data per l'allocazione proattiva delle risorse di calcolo, caching e comunicazione. La proattività si basa sulla capacità di prevedere le richieste degli utenti, il che richiede metodi efficaci per estrarre informazione dei dati dell'utente e della rete; b) elaborazione di segnali definiti su grafo: in molte applicazioni di interesse attuale, dalla biologia computazionale alla mappatura della funzionalità cerebrale, i segnali di interesse risiedono su domini non metrici, che possono essere rappresentati come grafi; c) rappresentazione ed elaborazione di grandi moli di dati eterogenei, ovvero dati di sensori, video, mobilità, posizionamento e altre informazioni specifiche, per la progettazione di nuove applicazioni di servizio in reti veicolari e Internet of Things. ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI Il settore si interessa dell’attività scientifica e didattico formativa nel campo dei Sistemi di Elaborazione delle Informazioni. Il settore è caratterizzato dall'insieme di ambiti scientifici e di competenze scientifico-disciplinari relativi al progetto ed alla realizzazione dei sistemi di elaborazione dell'informazione, nonché alla loro gestione ed utilizzazione nei vari contesti applicativi con metodologie e tecniche proprie dell'ingegneria. Rientrano in questo ambito i fondamenti teorici, i metodi e le tecnologie atti a produrre progetti tecnicamente validi, dal punto di vista sia dell'adeguatezza delle soluzioni proposte sia della possibilità di realizzazione tecnica nel campo del processamento dei dati. Tali fondamenti, metodi e tecnologie spaziano su tutti gli aspetti relativi alle infrastrutture software e hardware per i big data, l’organizzazione di basi di dati ad ampia scala, i sistemi informativi, i linguaggi di programmazione l'ingegneria del software, l'interazione persona-calcolatore, il riconoscimento dei segnali e delle immagini, l'elaborazione multimediale, la gestione dei documenti e dei processi, i linguaggi e le tecniche di ricerca per il web, i sistemi di gestione delle biblioteche digitali e per la ricerca di informazioni su basi documentali, l'ingegneria della conoscenza, l'intelligenza artificiale, il machine learning e la robotica. Rientrano nell'ambito di questo settore le competenze relative al progetto ed alla realizzazione degli impianti informatici e delle varie applicazioni dei sistemi di elaborazione, compresi i sistemi embedded, pervasivi e quelli telematici per la cooperazione sociale. I contributi al Dottorato in Data Science possono inoltre avere ramificazioni più ampie di quelle riportate sopra, attraverso sinergie già presenti con ambiti disciplinari diversi quali la biologia, le scienze mediche e la statistica. Ad esempio, in tale ambito trovano spazio temi di ricerca all’avanguardia, quali l’applicazione di tecniche avanzate di rappresentazione e analisi dei dati a problemi di interesse nello studio di sistemi biologici complessi o la caratterizzazione di tecniche algoritmiche o paradigmi computazionali per l’analisi dei dati insiti in numerosi sistemi complessi. ING-INF/06 BIOINGEGNERIA Il settore comprende l’attività scientifica e didattico-formativa relative a: (i) metodologie di base, che includono l’elaborazione di dati e segnali originati da sistemi biologici, le bioimmagini, e la rappresentazione della conoscenza medico-biologica; (ii) tecnologie, che includono i sistemi intelligenti artificiali, i sistemi per la gestione e l’organizzazione sanitaria, i sistemi informativi a livello di paziente, reparto, ospedale, regione, paese, l’informatica medica, e la telemedicina; (ii) aree di ricerca avanzata nella biologia e nelle neuroscienze, che includono le tecniche informatiche per la biologia e la neurologia (neuroinformatica e bioinformatica). L’inclusione di tali attività del Dottorato di Ricerca offre agli studenti l’opportunità di appropriarsi di strumenti culturali indispensabili per una carriera produttiva in campi promettenti della ricerca medica (4P Medicine, Network Medicine), biologica (Network Biology) e neuroscientifica (Connectomics), preparandoli inoltre ad assumere posizioni qualificate in aziende che producono innovazione nei campi dell’informatica clinica, informatica medica, imaging sanitario, e bioinformatica. III) Per le competenze relative alle Scienze Mediche e alla Salute sono presenti componenti dei seguenti SSD: MED/01 STATISTICA MEDICA Il settore si interessa dell’attività scientifica e didattico - formativa, nonché dell’eventuale attività assistenziale a esse congrua nel campo della Statistica medica delle metodologie epidemiologiche, biostatistiche e di organizzazione sanitaria applicate alla clinica, alla sanità pubblica ed alla medicina basata sull’evidenza (EBM), e ricomprende il disegno, l’analisi e la valutazione di studi sia sperimentali che osservazionali in medicina, biologia, veterinaria, farmacologia, genetica e genomica, l’identificazione di fattori di rischio e la valutazione delle politiche sanitarie, l’impatto degli interventi e le analisi di bio-banche e di database socio-sanitari e di fattori ambientali incidenti sulla salute. MED/09 MEDICINA INTERNA Il settore include competenze e ambiti di ricerca relativi allo studio e alla promozione, dal punto di vista sia teorico sia applicativo, del miglioramento della qualità di cura e dell’assistenza al soggetto affetto da patologie croniche come il diabete e la malattia cardiovascolare (dati complessi e di grandi dimensioni). In questo ambito si inseriscono, tra gli altri, i seguenti temi: i) studio e creazione di algoritmi “dinamici”di apprendimento per la previsione dell’andamento clinico del paziente in base a dati clinici pregressi ed ad informazioni inserite dal paziente attraverso la trasmissione “continua/periodica” di informazioni su database; ii) studio e creazione di algoritmi “dinamici”di gestione diagnostico terapeutica del paziente con patologia cronica attraverso dati clinici pregressi ed informazioni inserite dal paziente attraverso la trasmissione di “ continua/periodica” di informazioni su database; iii) studio e creazioni di applicazioni volte a migliorare stile di vita, aderenza a terapia e a monitoraggio clinico del paziente con patologia cronica. MED/26 - NEUROLOGIA Nell'ultimo decennio, un crescente numero di ricercatori ha utilizzato tecnologie wireless avanzate tra cui sensori indossabili basati su unità di misurazione inerziale (IMU), al fine di monitorare obiettivamente ed a lungo termine specifici sintomi in pazienti con malattie neurologiche tra cui la Malattia di Parkinson (MP). Le tecnologie wireless forniranno verosimilmente un utile strumento per la raccolta, analisi e visualizzazione di dati clinici su larga scala, fondamentali nella gestione clinica a lungo termine dei pazienti con malattie neurologiche. Il presente settore comprende competenze e aree di ricerca - dal punto di vista teorico e applicativo - volte a migliorare la diagnosi oggettiva, il monitoraggio a lungo termine di specifici sintomi motori e non motori, e infine la gestione clinica globale di diversi disturbi neurologici tra cui la MP. Nel dettaglio, il settore promuoverà studi con tecnologie wireless e algoritmi avanzati progettati per rilevare automaticamente specifici movimenti fisiologici e patologici, attraverso un monitoraggio continuo a lungo termine, consentendo quindi di prevedere le condizioni cliniche del paziente sulla base di dati precedentemente raccolti. Questo approccio fornirà inoltre nuove informazioni utili ad ottimizzare e personalizzare trattamenti farmacologici e non farmacologici in pazienti con MP e altri disturbi neurologici. MED/29 - CHIRURGIA MAXILLOFACCIALE. Il settore comprende attività scientifica, didattica e formativa nell’ambito della ricerca dell’analisi dei dati clinici con particolare riferimento all’applicazione della scienza delle reti in ambito odontostomatologico. Saranno quindi sviluppate le moderne tecniche di statistica computazionale per coniugare le informazioni contenute nei dati sperimentali con le conoscenze precedenti, disponibili in letteratura o da pregressi esperimenti, così da valutare la probabilità e la presenza d’ipotesi specifiche; un metodo assai utile nella ricerca biologica e medica. Un approccio statistico-computazionale in ambito odontostomatologico può essere riassunto come un sistema biologico dinamico che coinvolge più elementi interagenti tra di loro in una rappresentazione semplificata che rileva l'interazione tra gli elementi stessi; ciò può fornire spunti su come questi componenti influenzano (e possibilmente sono causali) l'uno dell'altro. Lo sviluppo e l’approfondimento dell’analisi delle reti complesse, e della loro applicazione in ambito odontostomatologico, chiariranno l'interazione tra le variabili d’interesse, mostrando come queste variabili interagiscono con ciascuna di esse. MED/36 - DIAGNOSTICA PER IMMAGINI, RADIOTERAPIA E NEURORADIOLOGIA Il settore include attività scientifica e didattico-formativa, nonché assistenziale nel campo della Diagnostica per immagini e radioterapia e della radiologia interventistica, degli organi e apparati e della medicina nucleare; specifiche competenze sono la radioterapia generale e oncologica e l’anatomia radiologica clinica. Studia anche la protezione dalle radiazioni, la radiobiologia medica e la diagnostica per immagini delle attività sportive. Si interessa inoltre della Neuroradiologia con specifica competenza nell’anatomia neuroradiologica clinica, nella neuroradiologia generale e interventistica e nella diagnostica per immagini del sistema nervoso. Si occupa inoltre della gestione delle immagini e dell’analisi dei dati archiviati per fini scientifici ed epidemiologici. Nello specifico del Dottorato di Ricerca in Data Science si intendono anche sviluppare tecniche avanzate di machine learning e deep learning per la diagnostica radiologica. IV) Per le competenze relative alle Scienze dell'Ambiente e del Territorio sono presenti componenti dei seguenti SSD: ICAR/06 TOPOGRAFIA E CARTOGRAFIA. Il settore si interessa dell’attività scientifica e didattico-formativa nei campi della geodesia fisica e spaziale, del positioning, della navigazione, del trattamento di immagini per finalità metriche e tematiche (fotogrammetria, telerilevamento), dei sistemi informativi geografici (GIS), della modellazione e dell’analisi statistica di dati geospaziali. I contenuti scientifico-disciplinari riguardano l’acquisizione, la modellazione, l’elaborazione, l’analisi, la gestione e la condivisione di dati geospaziali caratterizzati da opportuni indici di qualità. La crescente disponibilità di nuovi sensori per l’acquisizione di dati geospaziali e di piattaforme ad alte prestazioni computazionali per la loro gestione, analisi e condivisione ha esteso l’interesse del settore ai Geo Big Data e allo sviluppo di metodologie e modelli per il pieno utilizzo delle loro peculiarità (volume, variety, velocity and veracity) nell’ambito delle analisi ambientali, urbane, sociologiche e della gestione delle emergenze. Tematiche particolarmente significative dal punto di vista metodologico e applicativo riguardano l’acquisizione, modellazione, elaborazione e analisi di dati di posizione e navigazione da smartphone, lo sviluppo di tool GIS desktop, web and mobile per geodata science (Free and Open Source Software, Google Earth Engine), l’analisi di dati di mobilità, l’analisi di dataset globali ad alta risoluzione (OpenStreetMap, High Resolution Global Land Cover), l’analisi di Citizen science, Geo­crowdsourced and Volunteered Geographic Information (VGI) data, l’analisi di geodati per questioni di Climate Change e Land Use/Land Cover Change.

Prove di esame - orale

Giorno: 18/7/2018 Ora: 10:00 Aula: B203 Indirizzo: Via Ariosto 25
 

Prove - Valutazione titoli

Giorno: 9/7/2018 Ora: 10:00 Aula: B203, DIAG Indirizzo: Via Ariosto 25

Commissione

Membri effettivi

Prof. Sergio Barbarossa - Sapienza Università di Roma
Prof. Pierpaolo Brutti - Sapienza Università di Roma
Prof. Stefano Leonardi -Sapienza Università di Roma

Membri supplenti

Prof. Luca Becchetti - Sapienza Università di Roma
Prof.ssa Marianna Maranghi - Sapienza Università di Roma
Prof. Maurizio Vichi - Sapienza Università di Roma

 

Dipartimento
Informatica e Sistemistica 'Antonio Ruberti'
Contatti telefonici

+39 +39 06 77274022

Coordinatore

Stefano Leonardi (stefano.leonardi@uniroma1.it)

Staff

Stefano Leonardi

Graduatoria

© Sapienza Università di Roma - Piazzale Aldo Moro 5, 00185 Roma - (+39) 06 49911 - CF 80209930587 PI 02133771002