(Foto: Computerworld)

Fremtidens chips

Hvert år bliver fremtidens chips diskuteret på ISSCC-konferencen i San Francisco.

14. december 2012 kl. 12.51

Af Mads Ølholm, Alt om Data

Denne artikel er oprindeligt bragt på Alt om Data. Computerworld overtog i november 2022 Alt om Data. Du kan læse mere om overtagelsen her.

Konferencen afholdes på Marriott Marquis, men som du kan se på billedet, er der ikke meget at se på, da udstillingsmaterialet er minimalt – til gengæld er der mange guldkorn skjult i de forskellige præsentationer.

Konferencen starter med en gæstetaler, der i år var Eli Harari (se nedenfor), og som i sin tid grundlagde SanDisk. Eli Harari brugte sin tale til at diskutere fremtiden for flashhukommelse, som ifølge mange trues af andre hukommelsesteknologier.

Eli Harari konkluderede, at flash-memory har en fremtid de næste fem til ti år, da det har et gevaldigt forspring i forhold til andre teknologier, når det gælder hukommelsescellernes størrelse. I øjeblikket fremstilles der flash-hukommelse i 20 nm, der kan indeholde op til 2 bit i hver celle, mens konkurrerende teknologier typisk stadig fremstilles i 90 nm, hvilket betyder, at flash er cirka 17 gange mere effektiv, da cellerne er todimensionelle, hvorfor der skal regnes med et areal.

Der var ikke meget fokus på konkurrerende hukommelsesteknologier på årets konference, men der er absolut et potentiale, hvorfor de nok vender tilbage næste år.

Intel fører sig frem

I mikroprocessorafdelingen var det absolut Intel, der førte sig frem. Firmaet havde flere inter-essante papirer, der blev præsenteret, men som stort set ikke har været omtalt.

Det mest interessante var en eksperimental Atom-processor med integreret WiFi, som du kan se på siden overfor.

Umiddelbart lyder dette måske ikke så sindsoprivende, men det er vigtigt at forstå, at mikroprocessorer fremstilles i digital cmos, mens radio, som WiFi, fremstilles i analog cmos. De to teknologier er meget svære at placere på samme chip, og yderligere er analog cmos meget svær at skrumpe, hvorfor den typisk fremstiller 65 nm procesteknologi, mens digital cms er nået til 22 nm. Intel fremviste imidlertid et enkelt stykke silicium med både analog og digital cmos i 32 nm procesteknologi. Og ikke nok med det: Intel hævder også, at det uden større problemer kan lade sig gøre at skrumpe til i hvert fald 22 nm.

Resultatet er en enkelt chip med ekstra funktionalitet. Dette betyder et hurtigere, billigere og enklere design, når der skal anvendes færre chips. Det eneste, vi nu venter på, er, at den eksperimentelle chip bliver til et egentligt produkt.

Lav spænding er sagen

Intel viste også en anden eksperimentel chip, som adskiller sig fra andre processorer ved at kunne arbejde ved en meget lav spænding. Øverst til højre på siden overfor kan du se sammenhængen mellem frekvens og spænding.

Det er ikke noget problem at få logikken i en mikroprocessor til at fungere ved lave spændinger, men der er et problem med de transistorer, der udgør hukommelsen. For de fleste transistorer kan man imidlertid anvende en separat strømforsyning, men for de få transistorer, der udgør mikroprocessorens registre, lader dette sig imidlertid ikke gøre, da de er integreret med de øvrige transistorer, der udgør logikken.

Det er imidlertid lykkedes Intel at fremstille en – igen eksperimentel – mikroprocessor, der arbejder med frekvenser helt nede fra 3MHz, hvor den kun kræver 280 mV og helt op til 915MHz, hvor der kræves 1,2 V. Den meget lave spænding, der går under betegnelsen Near Threshold Voltage, betyder, at det kan lade sig gøre at skrue helt ned for effektforbruget, uden at det er nødvendigt at sende processoren i dvale. Den kan stadig arbejde med et minimalt strømforbrug, hvilket betyder, at den til stadighed kan overvåge inputsignaler uden hele tiden at skulle gå i dvale i korte perioder for derefter at vågne op, hvilket er en energikrævende proces.

Den kinesiske processor

De seneste år har der været kinesiske processorindslag. Sidste år var det Videnskabernes Akademi, som vi vender tilbage til om et øjeblik, men i år var det et universitet fra Shanghai, der viste en ny processorarkitektur, der inkluderer muligheden for at sende beskeder mellem forskellige processer i hardware.

Alle moderne operativsystemer inkluderer muligheden for at sende beskeder mellem processer og mellem operativsystemet og processer. Problemet er imidlertid, at dette ikke direkte understøttes af den underliggende hardware, hvorfor der anvendes delte hukommelsesområder, som kræver en del administration, hvilket betyder, at løsningen ikke er særlig effektiv.

State Key Laboratory of ASIC & System fra Fudan University i Shanghai har implementeret overførslen af beskeder direkte i hardware, og resultatet er en meget effektiv processor, som imidlertid stadig befinder sig på det eksperimentelle stadium – af den grund at der ikke findes ret meget færdigudviklet software, der kan drage nytte af den nye arkitektur.

Processoren er baseret på 16 processorkerner og trækker kun 320 mW.

Kinesiske fremskridt

Videnskabernes Akademi var ikke med på årets konference, men sidste år præsenterede ICT (Insitute of Computing Tecnology), der er en del af videnskabernes akademi Longson #c, en 16-kernet processor baseret på mips-arkitekturen, men med mulighed for at emulere Intels instruktionssæt.

Et besøg hos ICT i Beijing for nylig afslørede imidlertid en lang række fremskridt. Først og fremmest er det lykkedes at fremstille den første processor i 32 nm procesteknologi, hvor tidligere processorer har været fremstillet i 65 nm eller større. Den første processor i 32 nm er Longson 3B, der er en ottekernet processor. Ikke alene er processoren skrumpet til 32 nm, men den har også fået tilføjet en level 3-cache, som deles af alle processorerne, da den tidligere version viste sig ikke at have den optimale ydeevne.

Den kinesiske fremtid

I øjeblikket findes der en lang række kinesiske processorarkitekturer. Af disse er tre sponseret af staten, og i øjeblikket foregår der et intensivt arbejde på at forene de tre forskellige arkitekturer i en enkelt arkitektur.

Der er endnu ikke taget stilling til, præcis hvordan denne kommer til at se ud, men alt tyder på, at den bliver baseret på mips, da kineserne anser denne arkitektur for at være den reneste og den mest effektive. Under et møde hos ICT for nylig fortalte Yunji Chen, der er en af hoveddesignerne bag Longson, at arkitektur måske bliver helt mips-kompatibel, men i hvert fald sandsynligvis baseret på denne arkitektur.

Formålet med en fælles arkitektur er at forenkle softwareudviklingen af compilere med videre samt tilpasning af operativsystemer, som i øjeblikket tager alt for meget tid, fordi der skal designes til tre forskellige arkitekturer. I løbet af det næste års tid skulle der imidlertid være en afklaring på vej. Det er værd at notere sig, at en kinesisk processorarkitektur ikke er ensbetydende med, at andre arkitekturer bliver udelukket fra det kinesiske marked. Der er blot tale om en konsolidering af de lokale arkitekturer.

Hukommelsen bliver hurtigere og bedre

Mens vi alle sammen stadig anvender ddr3 som hukommelse i vores computere, foregår der en hurtig udvikling af ddr4, der skal erstatte ddr3. Formålet med ddr4 er at sænke effektforbruget, øge has-tigheden samt pålideligheden.

Blandt de mest aktive på dette område er Samsung, der præsenterede en 4GB ddr4-chip, der blot anvender 1,2 V, som du kan se til højre. chippen er fremstillet i en forholdsvis traditionel 30 nm procesteknologi. Chippen er interessant, da den har dobbelt integreret fejlkorrektion. Dette sker dels ved hjælp af paritet, og dels ved hjælp af en checksum-teknologi. De første chip er primært rettet mod fejltolerante servere, hvor den vil gøre designet enklere, da selve chippen indeholder fejlkorrektionen, hvor avanceret fejlkorrigering i øjeblikket for det meste er integreret i de controller-chips, der anvendes.

Samtidig med at Samsung viste sin nye ddr4-chip, var der dog også fokus på ddr3, men til mobile applikationer, hvor der i øjeblikket stadig anvendes ddr2. I smartphones anvendes der ddr2, hvilket er langsommere og har højere effektforbrug end ddr3. Derfor har Samsung udviklet en 4GB chip, der anvender ddr3-teknologi. Chippen arbejder ved 1,2 V og er fremstillet i 30 nm procesteknologi.

Når de mobile chip stadig er ddr2, mens chips til almindelige computere er ddr3, skyldes det, at chips med et lavt energiforbrug kræver et særligt transistordesign, som er sværere at producere end traditionelle transistorer.

Pseudoskandinavisk indslag

Som sædvanlig havde konferencen også et skandinavisk indslag. Det kom fra STMcicroelectronics, der viste en enkel, men avanceret forstærker til forstærkning af ultralyd. Det er ganske vist italienske forskere, der står bag designet, men bag det hele står professor Pietro Andreani fra universitet i Lund. Piero har tidligere været professor på DTU, men skiftede for nogle år siden til Lund. Piero anser det for en af sine vigtigste opgaver altid at være repræsenteret på ISSCC. Som han siger: Der findes masser af konferencer, hvor man kan præsentere, men ISSCC er den vigtigste – og bliver man accepteret her, ved man, at der er tale om god forskning.

Afslutningsvis

Den årlige ISSCC-konference er særdeles vigtig, hvis man vil holde sig opdateret inden for halvledere. Desværre er ISSCC temmelig dårlig organiseret, hvilket betyder, at dækningen i pressen er meget begrænset. For eksempel udsendes der hvert år pressematerialet inden konferencen. Men da materialet er på flere hundrede sider uden videre forklaringer, er det de færreste, der gider danne sig et overblik.

Så Alt om DATA vender selvfølgelig tilbage til konferencen næste år for at få en føling med den seneste udvikling. Ikke mindst på det kinesiske område, hvor der virkelig er gang i udviklingen af processorer, der ikke alene designes, men også i stigende grad produceres i Kina.