NGC Forskerservice

I NGC Forskerservice hjælper vi danske forskere med at få adgang til NGC Cloud og læseadgang til data i Den Nationale Genomdatabase.

Forsker du i personlig medicin og udfører videnskabelige undersøgelser af væsentlig samfundsmæssig betydning i samarbejde med en dansk forskningsinstitution? Så har du mulighed for at søge om adgang til en NGC Cloud på den nationale infrastruktur for personlig medicin og om læseadgang til data i Den Nationale Genomdatabase hos NGC Forskerservice.

Hvad tilbyder NGC Forskerservice?

NGC Forskerservice tilbyder forskere en skræddersyet cloud-løsning på den nationale infrastruktur for personlig medicin. Infrastrukturen består blandt andet af et nyt supercomputersystem, som kan lagre, behandle og analysere store mængder af sundhedsdata med den højeste grad af sikkerhed. Forskere kan anvende supercomputerens regnekraft gennem en skræddersyet NGC Cloud service.

En NGC Cloud service kan leveres enten som en NGC-managed Cloud eller en Self-managed Cloud. Du kan læse mere om de forskellige muligheder samt se eksempler og enhedspriser nedenfor.

En NGC-managed Cloud er en løsning, hvor NGC hjælper med alt teknisk konfiguration og opsætning. NGC står for sikkerheden og administrerer projektets brugeradgange. Da internettet ikke kan tilgås på en NGC-managed cloud, står NGC for opsætning af miljøet efter forskningsprojektets behov og for den løbende installation og vedligeholdelse af software. Services udbygges løbende, således at de hele tiden matcher de behov, der måtte være i forskningsprojektet. Der kan gives adgang til NGC’s analyseplatform, hvor bl.a. genomdata kan sammenstilles med egne data, forudsat at projektet har indhentet de rette godkendelser.

På en NGC-managed Cloud sættes interaktive jobs i kø på supercomputeren efter behov, og der betales kun for de aktuelle compute timer, som bliver brugt. Du kan derfor nemt skrue op og ned for forbruget afhængigt af dit projekts konkrete behov for analysekapacitet og lagringskapacitet.

 

Eksempel på brug af NGC-managed Cloud

Projektets data består af WGS-data fra 500 individer i 30x dybde, som gemmes i form af FASTQ-filer. FASTQ-filen for et individ fylder i gennemsnit 150 GB. Dermed opbevarer projektet i alt 75 TB rå-data.

I starten arbejder projektet kun med data fra 100 individer og har valgt at opbevare data i hhv. storage og archive. 15 TB (100 individer x 150 GB data) af projektets data bliver opbevaret i den aktive storage og analyseres løbende. De resterende 60 TB (400 individer x 150 GB data) opbevares i archive uden at blive behandlet. På denne måde optimerer projektet dets forbrug af midler. Hvis der skulle blive brug for analysere data i archive, kan disse flyttes til storage.

Projektet benytter en standard bioinformatisk pipeline til at bearbejde data. Det tager ca. 1.000 CPU-timer at køre et individs data igennem pipelinen. I alt vil projektet bruge 100.000 CPU-timer i perioden (100 individer x 1.000 CPU-timer). Projektet anvender kun Thin Nodes, da disse er egnet til at køre flere analyser parallelt på serverens mange CPU-kerner.

Priser for ovenstående forbrug i en måned (30 dage)

Enhed Antal Enhedspris Pris per måned (DKK)
CPU 100.000 timer 5,3 DKK/Node-time 13.248
Storage 15 TB 128,3 DKK/TB/mdr. 1.924,5
Archive 60 TB 65,1 DKK/TB/mdr. 3.906
Pris i alt     19.078,5

En Self-managed Cloud er tiltænkt projekter, der har brug for tilpasset beregningskapacitet og lagringsplads. Brugerne får med denne løsning mulighed for selv at sætte et skræddersyet cloud-miljø op. Denne ydelse omfatter i udgangspunktet kun infrastrukturservices. NGC etablerer således en cloud, men leverer ikke hjælp til opsætning og tilpasning af clouden med mindre dette er særskilt aftalt.

Det er dit projekts data manager og IT-afdeling, der styrer jeres Self-managed Cloud. I har derfor selv mulighed for at administrere brugeradgange samt styre installation og vedligeholdelse af software. Med en Self-managed Cloud er det også muligt at tilgå internettet.

 

Eksempel på brug af Self-managed cloud

Projektet arbejder med ”big data” bestående af flere tusinde variabler fra offentlige registre, patientjournaler og billeddata. Samlet set fylder projektets data 250 TB. Projektet laver regelmæssige tunge beregninger, der kræver parallelisering og store mængder af RAM-filer. Projektet udnytter også GPU-noder i forbindelse med machine learning-analyser af projektets billeddata. Derfor har projektet valgt at benytte en Self-managed Cloud, hvor de har eget dedikeret beregningskapacitet og fuldt råderum over projektets servere. Projektet er planlagt til at vare i tre år.

Det første år har projektet valgt at få tildelt fire dedikerede Thin Nodes, en Fat Node og en GPU node. De betaler en fast månedspris, hvor projektet frit kan benytte disse servere efter behov. Når projektet er færdigt med at bearbejde data og skal i gang med at benytte modeller, skaleres bestillingen ned til fire Thin Nodes og en GPU-node.

Prisen for ovenstående forbrug i en måned (30 dage)

Enhed Antal Enhedspris Pris per måned (DKK)
CPU 4 Thin Nodes + 1 Fat Node 7,9 DKK/Node-time 28.440
GPU 1 GPU Nodes 15,8 DKK/Node-time 11.376
Storage 250 TB 128,3 DKK/TB/mdr. 32.075
Pris i alt     71.891

Lovgivning

Genetiske data fra omfattende genetiske analyser, der er indsamlet i forbindelse med behandling eller forskning i sundhedsvæsenet efter 1. juli 2019, skal indberettes til os i Nationalt Genom Center og opbevares i Den Nationale Genomdatabase.

Forskning i personlig medicin 

Som forsker kan du søge om at få udstillet data fra Den Nationale Genomdatabase til brug for forskning inden for personlig medicin.

Dit forskningsprojekt skal opfylde følgende kriterier for at få adgang:

Forskningen skal være inden for feltet ’personlig medicin’ og være af væsentlig samfundsmæssig betydning.

  • Forskningsprojektet skal være forankret i en dansk forskningsinstitution.
  • Forskningsprojektet skal være godkendt af det videnskabsetiske komitesystem.
  • Hvis du ikke allerede har indgået en aftale med os om at anvende vores supercomputer til dit forskningsprojekt, skal der indgås en, før du kan få adgang. Læs mere om, hvordan du søger adgang til en NGC cloud.

Læs mere om Den Nationale Genomdatabase. Den Nationale Genomdatabase

 

Enhedspriser i 2024

Her kan du se enhedspriserne i 2024 for NGC-managed Cloud og Self-managed Cloud.

Bemærk at vi tilbyder to former for opbevaring: storage og archive. Storage er HPC lagring, hvor den opbevarede data stadig er aktiv og hurtigt kan benyttes til beregninger. Archive er langsommere HPC lagring, hvor data ikke er aktivt.

NGC-managed Cloud

CPU (DKK/node-time) GPU (DKK/node-time) Archive (DKK/TB/mdr.) Storage (DKK/TB/mdr.)
5,50 11,00 67,60 133,20

Priser excl. moms. CPU node-time gælder også ”FAT-nodes”.

 

Self-managed Cloud

CPU (DKK/node-time) GPU (DKK/node-time) Archive (DKK/TB/mdr.) Storage (DKK/TB/mdr.)
8,20 16,40 67,60 133,20

Priser excl. moms. CPU node-time gælder også ”FAT-nodes”.

Forskningssamarbejde

Nationalt Genom Center kan også indgå som samarbejdspartner i forskningsprojekter, der gerne vil fremme udviklingen af personlig medicin i Danmark. Du er velkommen til at kontakte NGC Forskerservice (forskning@ngc.dk) for at høre nærmere om mulighederne for dette.