Exascale-supercomputere kræver fuldt parallelle programmer

Illustration: Jesper Stein Sandal
Hvis supercomputere med 1 milliard milliard kommatalsberegninger pr. sekund skal realiseres, kræver det gennemgående parallelisering af programmerne. Men så burde det også kunne lade sig gøre, mener professor.

Den tid, hvor brugere af supercomputere bare kunne smække fødderne op på bordet og forvente en ny maskine, der mere end fordoblede den gamle computers kapacitet, når den var ved at være brændt ud, nærmer sig sin afslutning.

Det var udgangspunktet, da professor ved Sveriges Kungliga Tekniska Högskolan Erwin Laure fortalte om fremtidens exascale-arkitektur for supercomputere – datamaskiner, der kan håndtere én milliard milliard kommatalsberegninger hvert sekund (flops).

Det foregik for nylig i Fredericia, hvor DeiC (Danish e-Infrastructure Cooperation) holdt konference. DeiC er etableret under Uddannelses- og Forskningsministeriet.

Dagens supercomputere befinder sig i petaskala. Den alder indledtes, da IBM's Roadrunner i maj 2008 opnåede en konstant ydelse på 1,026 petaflops.

Men historien med eksponentiel skalering er nu slut. Den 'rigtige' Moores lov, der handler om tætheden af transistorer, fortsætter lidt endnu, men mest på grund af processorernes multikerne-arkitektur. Og skaleringen vil aftage inden for kort tid.

I den nye computerverden skal ydelsen øges gennem paralleliserede programmer og ‘datalokalitet’, hvilket vil sige, at data skal være tæt på de noder, der processerer dem.

Bedre parallelisme er vejen frem for exascale-supercomputere, mener Erwin Laure, der er professor ved Sveriges Kungliga Tekniska Högskolan. Illustration: Tania Andersen

»Vi må gøre systemerne større og forøge deres parallelisme,« lyder Erwin Laures bud på en løsning.

El-forbrug er en anden udfordring. Med dagens teknologi vil et exaflop-system trække effekt på 0,5 gigawatt, og den går ikke, mener Erwin Laure.

Data-parallelisme

Den parallelisme, der er brug for til exascale, er ikke af en ny slags. Det er de samme teknikker, vi benytter i dag, svarer Erwin Laure på Version2’s efterfølgende spørgsmål.

»Men det skal op i det ekstreme område. Og der er grænser for, hvor højt man kan skalere et problem for at nå det niveau, hvor man kan udnytte den kraft, der er til rådighed. Det betyder, at man skal bruge systemer, der er delt op i moduler, køre flere simuleringer på en gang og tidsbaseret parallelisering.«

I det sidste tilfælde opdeles et problem i faser, hvor faserne udregnes samtidig. Det betyder, at der er gætværk involveret, hvilket gør det svært.

»Der er også nye bud på parallelisering, såsom data-drevne modeller. Men i en rum fremtid kommer vi til at bruge de metoder, vi har i dag.«

Den data-drevne model har dog været i spil i et stykke tid. Den bygger på ideen om ikke at parallelisere programmets løkke-iterationer, men i stedet strømmer data fra kilde til destination i et dataflow, som paralleliseres, og hvor små operationer udføres på data. Lidt ligesom pipes i Unix- og Linux-verdenen, men meget mere finkornet.

Python, som i dag er det foretrukne sprog i den videnskabelige verden, vil også kunne bruges i de nye tider:

»Python er meget nemt at bruge. Jeg ser det som et sprog, der vil styre exascale-simuleringerne, som vil være programmeret i C og Fortran. Men i workflowet vil man kunne benytte Python.«

Det er også vigtigt, at værktøjer og sprog kan bruges ‘downstream’ – altså på mere almindelige talknuser-computere.

Dagens supercomputer-teknologier, såsom Message Passing Interface (MPI), der er en specifikation, som gør det muligt at sende meddelelser mellem noder og klynger, kan også tilpasses til exascale. Det viser forskning, som Erwin Laure har deltaget i.

Cpu'er med simplere kerner

Parallelisme løser dog ikke alle problemer. På hardware-siden stilles der, ikke overraskende, også nye krav. Almindelige processorer skalerer ikke, og man kan ikke fortsætte med dagens teknologi. Der er et behov for simplere kerner.

Det er ikke bare cpu’erne, som skal moderniseres. Den måde, man tænker lagring på i dag, som et system, der består af hukommelse, disk og måske bånd eller andre medier sidst i kæden, bliver mere kompliceret, med flere lag, hvor en vigtig skillelinje bliver mellem det, der tilknyttet en enkelt node, og den del, der er off-node.

I USA, Korea og Kina er der indenlandsk teknologi, der kan bruges til at bygge exascale-computere. Men i Europa findes der ikke en sådan, og i EU-regi giver det anledning til bekymringer. Det har medført, at 23 europæiske firmaer er gået sammen i et partnerskab om at skabe en 'fabl-less' chipproducent, altså en producent uden eget produktionsapparat. Den europæiske bilindustri skulle være interesseret i denne mulighed.

Men man fornemmer tydeligt i den efterfølgende spørgetid, at Erwin Laure ikke synes, det er en god ide, og han samtykker med en deltager, som fremfører synspunktet, at man skal købe den billigste teknologi på markedet.

I en fjernere fremtid, efter exaflop, kommer zettaflop – 1.000 gange flere operationer. Anvendelserne er for eksempel biologiske simuleringer i realtid, samt vejrprognoser, der på én dag kan beregne modellen 365 dage frem. Her bliver problemet, hvordan man udnytter de én million kerner, som et sådant fremtidigt tænkt system vurderes til at bestå af.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (7)
Hans Nielsen

'mest debatterede'-liste er lidt tynd.


Så ER det noget galt med jeres logaritme :-)

Man kunne jo includere også ældre tråde, også vægte antalet mindre efter alder.

Nu har i åbenbart bare, de mest debatterede NYE tråde de seneste dage.
Ikke meget information eller nytte i det.

Det er jo ikke kun debatten der har været lidt tynd i uge 42 :-)

Hvis man vægtet antal af debatindlæg med 50% mindre efter hver uge. Så ville også de mest interessante debatter blive vist, og holdt i gang. I stedet for at i må skrive en nyt, næsten enslydende artikel for at få lidt klik igen.

Christian Nobel

Nu vi taler om debatoversigt - kunne det ikke være muligt at når man går ind på
https://www.version2.dk/debat
at det så kun er sidste indlæg der kommer på oversigten, og ikke samtlige indlæg i alle debatter.

For hvis en debat er meget livlig, så forsvinder det sidste indlæg fra en anden tråd måske over på side 2 eller længere væk.

Mvh
Christian

Hans Nielsen

Re: Best Debatteret - Fejl i V2 logaritmer eller styret ?

For hvis en debat er meget livlig, så forsvinder det sidste indlæg fra en anden tråd måske over på side 2 eller længere væk.


Der kunne gøres meget ved debatten på V2, det har vist være diskuteret længe og meget i debatten, ikke på V2 ?

Især 4 ting, synes jeg at der kunne gøres bedre. Især de 2 første vil være særdeles godt for debat ånden, styringen og debattørerne. Også for dem som følger med, og læser den.

Når man sletter "vilkårlige" indlæg, så at skrive at her er der/var der et indlæg. Evt stadig med indikation fra hvem, og med en kort forklaring på sletning. Altså hvad for en del af v2 politik der ikke var overholdt.
- Så slipper man også med den stærkt ødelæggende vane, med at måtte slette hele tråde. Og ødelægge debat og forforståelse.

Mulighed for svar til svar (til svar). Altså indlejring. Så ville meget af den debat, som måske kan være kørt af sporet, af andre. Fortsætte i en tråd, som man kan klikke til og fra.
- Det vil måske og spare mange slettet indlæg. På grund af "ikke at høre til emnet" Da en lang debat mellem 2, ikke behøves at fylde tråden op.

Måske mulighed for at klikke en skribent fra.
- Så behøves der heller ikke at være så meget moderation. Igen som i 2 forslag nr 2. Det bliver kun reklame, stærkt racistisk, eller meget konstante løgne, eller som det hedder i dag. Fake news som skal redigeres,

I kunne måske også gøre thumbs up/ned IKKE anonym. Kan og skal man ikke stå ved sin mening. Giver selv gerne thumbs up, men meget sjælden ned.
-Synes selv det er en uskik. Hvis man er så stærkt utilfreds med et indlæg. Så kan man skrive et svar til vedkommende. Thumbs up til dette er jo lidt mere elegant,end thumbs ned

Men nu den her tråd ER helt forplumrer. Kan andre ikke skrive deres forslag. Evt med thumbs up til mig eller dem med gode forslag. hvis der altså er læsere her i Vinterferien. Så kunne det være at V2 overvejet vores allesammen gode forslag en gang til :-)

Kenn Nielsen

For hvis en debat er meget livlig, så forsvinder det sidste indlæg fra en anden tråd måske over på side 2 eller længere væk.


Og på side 2 kan ingen høre dig skrige ;-)

Forstået på dén måde, at selv de livligste debatter uddør "tæt på omgående", når de ender på side > 1 .

Hér i jylland vil vi nok kalde det "lidt træls".

K

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 2017

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017
Jobfinder Logo
Job fra Jobfinder