Presenti:
Cristina Knapic, Carolina Berucci, Carlo Cavazzoni, Claudio Gheller , Daniele Spiga, Antonio Stamerra, Tommaso Boccali.
Discussione:
CK : vorremmo trovare degli obiettivi comuni per la realizzazione di un Data Lake che possa soddisfare le esigenze di aderenza al framework GAIA-X e su cui testare e istanzaire un esempio portabile da infrastruttura pubblica a infrastruttura privata. Al momento le regole degli IG non sono ancora definitive per cui si vuole concentrarsi sugli obiettivi e le Milestones.
CC : Leonardo ha già condiviso un template per raccogliere le idee progettuali e da consolidare nel prossimo CdA. La deadline è 30 o 31 maggio.
Ci sono 3 grosse linee di sviluppo che si vorrebbero perseguire:
CG : Riassumendo queste attività possono rientrare come partecipazione da parte di Leonardo come partner nell'HUB o come finanziatore di postdoc/contratti presso gli spokes. Nell'ottica di sviluppo è un'attività aderente e di interesse per lo spoke 3 e siamo in grado di fornire dati di esempio o di test certamente nel radio e anche nell'ottico.
DS : Spoke 2 ha interesse nel fornire meccanismi di blockchain e tracciare l'evoluzione dei dati durante la loro elaborazione.
CK : Come spoke 3 possiamo certamente fornire il know how della modellazione del data model e della integrazione dei metadati aggiuntivi richiesti dallo standard GAIA-X perchè sembrano essere di alto livello e di thrustability tra infrastrutture. Quali tools o sistemi si pensa di usare?
CC: Quello che attualmente offre la suite Apache integrate in containers con Bucket S3 e Spark. Oppure quello che viene suggerito come portfolio da altri progetti come EOSC.
CK: Possiamo cercare di definire delle milestones?
CC: Prima di parlare di milestones, possiamo parlare di impegno: potrebbe esser ragionevole 1 FTE per 12 mesi, partendo dal presupposto di fare solo lavoro di integrazione dei vari servizi e poco altro. Si apre il problema dei dati secretati.
TB : potremmo pensare all'encription..
CK: per quanto riguarda l'encription dipende molto dalle risorse di calcolo che avremo a disposizione perchè per fare un dimostratore, non ci saranno problemi ma se parliamo del Big Data, l'encription potrebbe richiedere troppe risorse.
CG : Concorda che in astrofisica e col big data non abbiamo mai pensato a fare criptazione.
CK: si rimane di organizzare il prima possibile la proposta progettuale.