Home » Processor » Skal din næste cpu være en gpu?
Skal din næste cpu være en gpu?

Skal din næste cpu være en gpu?

Share

Vil en gpu (Graphics Processing Unit) give din pc en stor
hastighedsforøgelse eller er gpgpu-beregning bare endnu en
forbipasserende fase. Vi undersøger, om du skal hoppe med på vognen

Alle taler om supercomputing på desktoppen – og i særdeleshed, om det vil være gpu’er, der gør det muligt. Vi har tidligere skrevet om, at general-purpose-beregning på gpu’er (et begreb kendt som gpgpu) måske vil blive kendt som ”den vigtigste computertrend de næste ti år.” Når det kommer til påstande, så er det en af de større. Men hvis du vil have bevis på industriens tillid til det nye koncept, så bare se på de firmaer, der vil have et stykke af gpgpu-kagen: NVIDIA, AMD, Intel, Microsoft, IBM, Apple og Toshiba vil alle have en bid.

Det er ikke kun gætværk, der styrer den store interesse: gpgpu-systemer har allerede ydet højere end klynger baseret alene på cpu’er, på felter så alsidige som molekylær dynamik, ray tracing, medicinsk billedhandling og sequence matching. Den kombination af parallel cpu- og gpu-behandling, der giver disse resultater, bliver ofte kaldt ‘heterogen databehandling’.
Gpgpu-konceptet gør gpu’en i stand til at opføre sig som en alsidig co-processor.

Som NVIDIAs David Luebke har antydet, så bliver computere ikke længere hurtigere; skiftet til multiprocessorer betyder, at de faktisk bliver bredere. Det er den ide, som gpgpu-databehandling benytter sig af. Ved intelligent flytning af datatunge opgaver fra cpu’en til andre processor-kerner (såsom grafikkortet), opnår udviklere forbedret programydelse gennem parallelisme.

Gpgpu’en er næppe en ny ide. Ifølge hjemmesiden www.gpgpu.org er gpu-teknologi blevet brugt til talknusning siden 1978, da Ikonas udviklede et programmerbart raster display-system til cockpit-instrumentering.

Fra cpu til gpu

Moderne gpu’er er ideelle co-processorer. Ikke alene er de billige, de er også lynende hurtige, takket være tilstedeværelsen af mange processor-kerner. Mens cpu’er er designet til at behandle tråde sekventielt, så er gpu’er designet til at brænde gennem data parallelt. NVIDIAs GeForce GTX 280, for eksempel, er bygget til hastighed. Som en spilleenhed er den i stand til at levere flydende højopløste billeder og realtidseffekter. Prøv bare engang at se Far Cry 2 i 1.920 x 1.200 pixel.

Med 1,4 milliarder transistorer behersker GeForce GTX 280 hele 350 programmerbare shader-kerner, som kan give 993 Gigaflops (flops = FLoating point Operations Per Second) processorkraft. AMDs grafikteknologi er tilsvarende potent.

Deres serie 4800 Radeon HD-kort har 800 programmerbare kerner og GDDR5 hukommelse til at levere 1,2 Teraflops processorkraft. ”Streng styring af gpu-programmer muliggør effektiv adgang til data,” siger Shankar Krishnan fra AT&T Research Labs. ”Dette imødegår behovet for omfattende depotarkitekturer, som der er brug for på traditionelle cpu’er, og tillader en langt højere tæthed af regneenheder.” Hvis du ikke lige spiller Far Cry 2 eller Fallout 3, så sidder alt dette processorpotentiale selvfølgelig bare og keder sig. Gpgpu’er vil tillade os at se, hvad der vil ske, hvis andre programmer er i stand til at bruge et grafikkorts processorer.

Stream processing

Dette er grunden til, at NVIDIA og AMD vil tæmme deres grafikkorts gpgpu-potentiale. NVIDIAs Tesla Personal Supercomputer, for eksempel, kombinerer en traditionel quad-core arbejdsstations-cpu med tre eller fire Tesla C1060-processorer. En C1060 er reelt et GeForce GTX 280 med 4GB GDDR3 hukommelse og ingen video-output.

Hver C1060 kan yde 933 Gigaflops single-precision floating point performance, så NVIDIAs topklasse fire-gpu S1070 system pakker op til 4,14 Teraflops processorkraft i hvert rack. Tokyos Institute of Technology købte for nyligt 170 af dem for at give deres Tsubane-computer ekstra kræfter.

Se også:  Ny bærbar job-pc med AMD-processor – attraktiv pris

Gpu’er er ideelle talknusere, fordi de er designet til at behandle ‘strømme’ af data og bruge forprogrammerede operationer til hver del. Gpu’er yder bedst, når de arbejder med store datasæt, der kræver ens beregninger. Det Calgary-baserede firma OpenGeoSolutions bruger NVIDIAs Tesla hardware til at forbedre deres seismiske modellering via en teknik kaldet spektral dekomponering.

Processen involverer analyse af lav-level elektromagnetiske frekvenser (forårsaget af variationer i stens massefylde) til at bygge et stratigrafisk billede af jordens geologi. På et typisk cpu-baseret cluster tog det mellem to timer og flere dage at bygge billeder af undergrunden. Med et Tesla-system kunne OpenGeoSolutions rapportere en ydelsesforøgelse, der var ”fuldstændig uhørt.”

Forskning

AMD har imidlertid lavet en aftale med Silicon Valleys unge firma Aprius Inc om at levere FireStream 9270-kort til Aprius CA8000 Computational Acceleration System. Ligesom Radeon HD 4800 seriekortene, har FireStream 9270 800 processor-kerner. CA8000 kombinerer otte af disse kort til et 4U system, som kan fremvise 9,6 Teraflops accelerations-ydelse.

Hvad skal al denne styrke så bruges til? Aprius antyder, at cad/cam klimamodeller, medicinsk billedbehandling og signalbehandlingssystemer alle vil kunne udnytte den. Stanford University bruger allerede Radeon gpu’er til at øge hastigheden på deres proteinfoldningssimulationer. Tallene, der bliver knust af Folding@home-projektet, har potentialet til at hjælpe med at kurere alzheimers og parkinsons i fremtiden.

Det er alt sammen meget godt, kunne du måske sige, men jeg skal nok ikke løse avancerede ligninger eller lede efter olie under Alaskas is. Hvilken betydning vil det her have på en almindelig pc, udover til spilbrug? Lige nu, ikke ret meget. Hvis du har et gennemsnitligt grafikkort, såsom NVIDIA GeForce 9600 GT (som har 64 indviduelle stream-processing kerner), kan din cpu allerede håndtere realtids fysiske effekter.

NVIDIA flyttede Ageis PhysX-kode til deres serie 8 gpu’er efter de købte firmaet tilbage i februar 2008. Fornyligt har vi set potentialet for hurtigere medie-kodning med udgivelsen af Badaboom. At rippe en dvd, eller konvertere en videofil ville typisk monopolisere et system, der kun havde cpu’er. Bygget med NVIDIAs CUDA-sprog, allokerer Badaboom denne datatunge opgave til en NVIDIA-gpu, så cpu’en stadig kan bruges til de daglige opgaver.

Gpgpu’en og dig

Adobes Photoshop CS4 er blevet optimeret til at aflaste visse opgaver til enhver Shader 3.0- kompatibel gpu. Filtrene i Photoshop er ikke så forskellige fra pixel shadere. En traditionel cpu vil lægge hvert filter på sekventielt, så billeder tager flere sekunder at gentegne. Ved at bruge en gpu’s parallelle arkitektur, kan filtre blive tilført et billede i realtid for at give øjeblikkelige resultater.

Photoshop CS4 bruger OpenGL og gpu-acceleration til at forbedre zoom, rotering og overgange på alle visningsniveauer. Farveafstemning er også blevet forvist til grafik-chippen. Du mister ikke nogen egenskaber ved ikke at have en kompatibel gpu, men, som Adobes Senior Vice President John Nack påpeger, så vil en pc med et godt grafikkort ”feje de computere af banen, som ikke har en.”

CyberLinks PowerDirector 7 software lover ”op til fem gange hurtigere video preview og gengivelse” med hjælp fra gpu-ressourcer. Dog skal det nævnes, at som med PhotoShop CS4, så kan denne ekstra ydelse kun bruges fuldt ud, når den bruges til avancerede effekter. S3 Graphics har imidlertid annonceret udgivelsen af S3FotoPro, et billedbehandlingsprogram som udnytter deres Chrome 400/500 chips gpgpu-potentiale.

Se også:  Byg en stærk gaming-maskine med super-grafikkort

Ifølge S3 Graphics, så bruger S3FotoPro intelligente billedbehandlingsalgoritmer, som kører på gpu’en, til at ”analysere og automatisk justere store og små detaljer i et billede for at forbedre billedkvaliteten.” Tilgængelige billedforbedringsteknikker inkluderer farveskarphed, de-fogging, hududglatning, gradueret blanding og mætning af farver samt tonebalancejusteringer og -optimiseringer.

”Med understøttelse af de seneste gpgpu-programmer og sprog, giver S3FotoPro et meget brugbart og alsidigt værktøj til slutbrugere og vore partnere,” siger Michael Shiuan, Vice President for Hardware Engineering hos S3 Graphics. ”Programprocesser, som krævede dage at behandle, kan nu færdiggøres på sekunder, hvis man bruger et gpgpu-produkt som vores.”

Gpgpu-problemet

Selvom gpu’er er ekstremt effektive til at streame og behandle data, så er de fleste pc’er serielle af natur. En gpu kan ikke sætte turbo på dit tekstbehandlingsprogram, for eksempel, eller øge hastigheden af dit antivirusværn.

”En af grundene til at gpu-designere kan levere enorme toppræstationstal er, at de i høj grad har begrænset arkitekturen,” siger Anwar Ghuloum, en ledende ingeniør hos Intels Microprocessor Technology Lab. ”Hvad dette betyder er, at de kan designe mere effektive processorer ved ikke at beskæftige sig med rodede irregulære databehandlingsmønstre, som de fleste programmer uvægerligt må håndtere. Dette inkluderer løkker, uforudsigelige forgreninger og uregelmæssig hukommelsesadgangsmønstre.” Læs mere på Ghuloums blog på www.tinyurl.com/4eqr3l.

Gpu’er brillerer i parallel databehandling, fordi de har mange matematiske enheder og hurtig tilgang til integreret hukommelse. De opnår også en høj ydelse på parallelle opgaver, fordi programmer kan afvikles på hver shader-kerne. Cpu’en styrer dog stadig flokken, når det kommer til parallel opgavebehandling, fordi deres hurtige caches gør dem i stand til effektiv data-bevarelse, og de kan håndtere forgreninger. Cpu’er kan opnå høj ydelse på en enkelt tråd. Med andre ord, processorerne komplimenterer hinanden.

For at få det meste ud af dette cpu/gpu-partnerskab i fremtiden, vil udviklere skulle ændre den måde, applikationerne er kodet på. Det er her programmeringssprog som CUDA og OpenCL kommer ind (se boksen med ‘Branchens værktøj’ for mere information.).

Vi mangler stadig at se det bedste af, hvad gpu-beregning kan tilbyde. Programmerbarheden af gpu-kerner kunne gøre realtids ray-tracing muligt, mens konceptet med gpu-accelereret lagring kunne tillade pc’er at kryptere og komprimere filer i farten. Gpgpu-konceptet er endda heller ikke begrænset til desktop-systemer og arbejdsstationer alene. Det kan også bruges på mobile enheder.

En alternativ fremtid

Et andet muligt scenarie er, at de nuværende gpgpu-initiativer bare er en midlertidig løsning, indtil cpu- og gpu-platforme nærmer sig hinanden. I et nyligt interview med websiden Ars Technica, antyder Epic Games medstifter Tim Sweeney at: ”I den næste konsolgeneration kunne konsoller bestå af en enkelt – endnu ikke defineret – chip. Det kunne blive en generel processor, der har evolveret fra en tidligere cpu- eller gpu-arkitektur, og den kunne potentielt køre alting – grafikken, AI’en, lyden – på en fuldstændig homogen måde. Det er en meget spændende udsigt, fordi det kunne simplificere værktøjet og processerne for at skabe software dramatisk.”

Det lyder lidt som Intels Larrabee-projekt, som er planlagt til lancering i starten af 2010. Så måske er en dramatisk ændring i processer-arkitektur ikke så langt væk, som nogle tror. En ting er dog sikkert: Lad være med at affærdige gpu’en lige med det samme.


TAGS
AMD
gpu
Grafikkort
nvidia

DEL DENNE
Share


Mest populære
Populære
Nyeste
Tags

Find os på de sociale medier

Modtag dagligt IT-nyhedsbrev

Få gratis tech-nyheder i din mail-indbakke alle hverdage. Læs mere om IT-UPDATE her

Find os på FaceBook

AOD/AOD.dk

Brogårdsvej 22
DK-2820 Gentofte
Telefon: 33 91 28 33
redaktion@aod.dk

Audio Media A/S

CVR nr. 16315648,
Brogårdsvej 22
DK-2820 Gentofte
Telefon: 33 91 28 33
info@audio.dk
Annoncesalg:
Lars Bo Jensen: lbj@audio.dk Telefon: 40 80 44 53
Annoncer: Se medieinformation her


AOD/AOD.dk   © 2020
Privatlivspolitik og cookie information - Audio Media A/S