Innovation Grant - Leonardo

UTC
Description

Presenti: 

Cristina Knapic, Carolina Berucci, Carlo Cavazzoni, Claudio Gheller , Daniele Spiga, Antonio Stamerra, Tommaso Boccali.

Discussione:

CK : vorremmo trovare degli obiettivi comuni per la realizzazione di un Data Lake che possa soddisfare le esigenze di aderenza al framework GAIA-X e su cui testare e istanzaire un esempio portabile da infrastruttura pubblica a infrastruttura privata. Al momento le regole degli IG non sono ancora definitive per cui si vuole concentrarsi sugli obiettivi e le Milestones.

CC : Leonardo ha già condiviso un template per raccogliere le idee progettuali  e da consolidare nel prossimo CdA. La deadline è 30 o 31 maggio.

Ci sono 3 grosse linee di sviluppo che si vorrebbero perseguire:

  1. Testare e validare una platform as a service su cui deployare containers su cui istanziare Basi Dati e Dati (data lake) distribuito e vedere come poter passare dalla PAS INFN ad una privata (basata su Openshift di RedHat da un Kubernetis - Vanilla.
  2. Cercare i punti di contatto tra i data lake proposti da GAIA-X e quello proposto da EOSC, in modo da capire cosa accomuna i due mondi e quali sono i punti di contatto.
  3. SEtup di un servizio distribuito possibilmente focalizzato su immagini radio o ottiche per la ricerca di space debris e delle loro orbite. Sarebbe utile avere degli use cases e il data flow fornito come servizio di blockchain. 

CG : Riassumendo queste attività possono rientrare come partecipazione da parte di Leonardo come partner nell'HUB o come finanziatore di postdoc/contratti presso gli spokes. Nell'ottica di sviluppo è un'attività aderente e di interesse per lo spoke 3 e siamo in grado di fornire dati di esempio o di test certamente nel radio e anche nell'ottico.

DS : Spoke 2 ha interesse nel fornire meccanismi di blockchain e tracciare l'evoluzione dei dati durante la loro elaborazione.

CK : Come spoke 3 possiamo certamente fornire il know how della modellazione del data model e della integrazione dei metadati aggiuntivi richiesti dallo standard GAIA-X perchè sembrano essere di alto livello e di thrustability tra infrastrutture. Quali tools o sistemi si pensa di usare?

CC: Quello che attualmente offre la suite Apache integrate in containers con Bucket S3 e Spark. Oppure quello che viene suggerito come portfolio da altri progetti come EOSC.

CK: Possiamo cercare di definire delle milestones?

CC: Prima di parlare di milestones, possiamo parlare di impegno: potrebbe esser ragionevole 1 FTE per 12 mesi, partendo dal presupposto di fare solo lavoro di integrazione dei vari servizi e poco altro. Si apre il problema dei dati secretati.

TB :  potremmo pensare all'encription..

CK: per quanto riguarda l'encription dipende molto dalle risorse di calcolo che avremo a disposizione perchè per fare un dimostratore, non ci saranno problemi ma se parliamo del Big Data, l'encription potrebbe richiedere troppe risorse.

CG : Concorda che in astrofisica e col big data non abbiamo mai pensato a fare criptazione.

CK: si rimane di organizzare il prima possibile la proposta progettuale.

The agenda of this meeting is empty