NET4EXA
NET4EXA - Network for European Exascale Systems
ID Call: HORIZON-EUROHPC-JU-2023-INTER-02 Innovation Action in Low Latency and High Bandwidth Interconnects
Ruolo di Sapienza nel progetto: Affiliated entity
Responsabile scientifico per Sapienza: Daniele De Sensi
Dipartimento: Informatica
Data inizio progetto: 01/09/2024
Data fine progetto: 28/02/2027
Abstract del progetto:
Il progetto NET4EXA mira a creare un'interconnessione avanzata per sistemi HPC e AI, inclusa l'applicazione a modelli di linguaggio di grandi dimensioni (LLM), che possa scalare fino a centinaia di migliaia di nodi di elaborazione.
Sulla base del successo dell'interconnessione HPC europea BXI (BullSequana eXascale Interconnect), NET4EXA continuerà lo sviluppo della prossima generazione di interconnessioni europee (BXIv3).
Le versioni precedenti, BXIv1 e BXIv2, sono state implementate in supercomputer europei classificati tra i TOP15.
Il progetto presenterà un progetto pilota completamente funzionante al TRL 8, pronto per l'adozione e l'integrazione in supercomputer europei exascale e post-exascale.
Il progetto contribuirà offrendo analisi e progettazione preliminare per le prossime funzionalità di interconnessione, aprendo così la strada a continui progressi nel settore. NET4EXA preparerà anche la versione successiva, BXIv4.
Sapienza contribuisce al progetto NET4EXA in qualità di partner affiliato di CINECA, apportando una solida competenza nel campo del calcolo ad alte prestazioni e delle tecnologie di comunicazione.
Il nostro lavoro si concentra sulla progettazione e valutazione dell'interconnessione BXI di nuova generazione (BXIv3 e BXIv4), incluse funzionalità avanzate come operazioni collettive in-network e l'offload dello stack TCP. Contribuiamo inoltre allo sviluppo e all'ottimizzazione di meccanismi di routing adattivo e di controllo della congestione, componenti chiave per una comunicazione efficiente e scalabile.
Sapienza è coinvolta nella progettazione di algoritmi di comunicazione collettiva topology-aware e nella valutazione di modelli di programmazione come MPI per valutare quanto possano sfruttare le funzionalità specifiche di BXI, come i trasferimenti di dati non contigui, la sovrapposizione tra comunicazione e calcolo e l'offload.
Combinando l'accelerazione hardware con miglioramenti a livello software, Sapienza contribuisce a scoprire i limiti tecnici e promuove l'ottimizzazione delle interconnessioni HPC di nuova generazione.