Artikel top billede

(Foto: Computerworld)

Intels hemmelige våben

Intels QuickSync-videotranscode er det bedste ved Ivy Bridge. Den er imponerende.

Af Torben Okholm, Alt om Data

Denne artikel er oprindeligt bragt på Alt om Data. Computerworld overtog i november 2022 Alt om Data. Du kan læse mere om overtagelsen her.

Vi synes, at tiden er inde til at begynde at tage Intels QuickSync-videotranscode alvorligt. QuickSync er som bekendt den hardwareaccelererede transcoder, der følger gratis med alle de chips, der bliver lavet til LGA 1155-soklen. Man kan argumentere for, at den er det mest spændende stykke hardware, man i øjeblikket kan få til desktop-pc’er. Det viser vores seneste erfaringer med Intels seneste Ivy Bridge-processorer.

Den første smagsprøve på Ivy Bridge via den nye Intel Core i5-3570K var en stor skuffelse. Den megen begejstring før lanceringen gjaldt de mindste højtydende transistorer nogensinde i form af Intels nye 22 nm-node. Disse eksotiske nye 22 nm-transistorer var ikke kun små. Intel havde også promoveret sin nye såkaldte 3D Tri-gate-teknologi og hævdede at have opnået hidtil usete forbedringer i strømflow og effektivitet.

Alt i alt mente Intel, at kombinationen af 22 nm-teknologi og 3D Tri-gate-transistorer var et stort spring fremad. Intel lovede også markante ændringer i udformningen af Ivy Bridge-generationen. Den nye proces og den ændrede arkitektur skulle være nok til, at Intel kunne kalde Ivy Bridge for tredje generation af Core-processoren.

Vand under broen?

Virkeligheden er langt mere kuldslået. Ivy Bridge har ikke flere kerner. De fleste modeller har ikke højere frekvens end de tilsvarende Sandy Bridge-processorer. Intel har ikke gjort meget for at ændre kernerne. Og der er ikke mere cache.

Den største skuffelse var imidlertid overclocking. Bevares, vores testchip nåede næsten 5GHz, men det samme gør Sandy Bridge-processorer. Der var dog et aspekt ved vores test, der var virkelig morsomt, og det var QuickSync-videokernen, der kværnede videodata.

Du kan se de komplette testdetaljer på næste side, men begynd først her: Med QuickSync kan du transkode en timelang hd-episode af Game of Thrones, så den passer til en smartphone eller en tablet, og du kan gøre det på få minutter.

Hvis du gør det samme med cpu-kernerne i den allerhurtigste Ivy Bridge-processor, skal du regne med at vente i ti minutter eller endnu længere. Hvis du har en ældre cpu, kan det tage to-tre gange så lang tid.

Man kan lære noget af dette her: Fremtiden for computerarbejde omfatter ikke nødvendigvis en endeløs march af cpu-kerne med stadig mere vanvittige clockfrekvenser. Det er snarere sandsynligt, at det ekstra transistorbudget, der følger med die shrinks, vil blive brugt til at levere speciel eller funktionsfikseret hardware, der er beregnet til specifikke opgaver.

Men før vi spekulerer på, hvor Quick- Sync er på vej hen, og hvilke andre faste funktioner Intel vælger at putte i kommende chips, skal vi se nærmere på, hvordan QuickSync virker, og hvordan den har udviklet sig.

Teknologien kommer først frem i Sandy Bridge-familien af chips, og grundideen er stadig den samme. Tag den yderst parallelliserede grafikkraft i den integrerede videokerne, som Intel nu knytter til alle virksomhedens mainstream-processorer, og tilføj lidt funktionsfikseret hardware. Så har du en imponerende maskine til videooprettelse.

Detaljerne begynder med en hardwaredekoder. Hele pipelinen bliver afkodet i hardware. Som enhver god computerentusiast ved: Specialiseret hardware gør tingene meget, meget hurtigere end almindelig computerteknik, såsom en cpu-kerne, der bruger softwarealgoritmer til at løse den samme opgave. En anden fordel er energieffektivitet. Funktionsfikserede kredsløb er meget mindre og bruger mindre strøm, og det gør dem ideelle til mobile løsninger. Hold fast i den tanke, for vi vender tilbage til den om lidt.

Ulempen ved alt dette er reduceret fleksibilitet. Til at begynde med bliver det svært at understøtte nye videocodecs. Hvis man bruger ren hardware til kodning, får man begrænsninger i de indstillinger og parametre, man kan bruge. Af den grund anlægger Intel en anden holdning, når det gælder kodning.

Her bliver opgaven delt mellem funktionsfikseret hardware og shaderne inden i grafikkernen. Det er et ret komplekst foretagende, men hovedopgaven, der bliver håndteret af den funktionsfikserede hardware, består i at knytte cosinusændringer til pixels, men shaderarrayet håndterer overførsel af bevægelse, hvilket normalt er den mest krævende del af processen.

Hurtig kodning

Som du kan se af testtallene, er resultaterne meget imponerende. I vores test er QuickSync omkring fire gange hurtigere end kodning på cpu-kernerne i vores Core i7-3770K, som er en meget hurtig processor. Sammenlignet med for eksempel en to-tre år gammel dual core-pc er forskellen monumental.

Lige så slående er den omstændighed, at Intels QuickSync-videoteknologi præsterer at overskygge dis-krete gpu’er fra Nvidia og AMD, når det gælder video-transkodning. Nvidia får tydeligvis ikke det fulde udbytte af den rå kraft, der ligger i de 1.536 shaderkerner i GeForce GTX 680.

I anden udgave af QuickSync har Intel givet den funktionsfikserede afkoder en overhaling for at forbedre ydelsen. Men vigtigere er ændringerne i shader-kernerne. Den kraftigste udgave af den integrerede HD Graphics 4000 har ekstra 4 kerner og i alt 16. Desuden er hver kerne mere kompleks, delvis fordi den nu understøtter DirectX 11. Alt i alt er der markant mere computerkraft.

Alt det lyder herligt, men der er i hvert fald et større forbehold: QuickSync kræver fuld applikationssupport for at levere sin videoknusning. Det er den store forskel i forhold til almindelige cpu-kerner. De kan klare det meste af det, man udsætter dem for.

Listen over større applikationer, der understøtter QuickSync, var til at begynde med ynkelig. Men nu vokser den (se forrige side). Kodedelen af listen er dog begrænset til forbrugerprogrammer snarere end til professionelle applikationer. Sony Vegas kommer tættest på at være en professionel applikation, men den er strengt taget midtimellem.

Popvideo

Ifølge Dava Salvator, Intels orakel, når det gælder grafik, skyldes det, at hardcore videofolk »stadig foretrækker at bruge software. De betragter det som et spørgsmål om billedkvalitet«. Lige nu er QuickSync ikke helt fleksibel nok til at charmere den professionelle videoproduktionsbranche.

Det er måske også meget godt. Når man ser, hvor hurtigt QuickSync løser videoopgaver, må man spekulere på, hvor fornuftigt det er at købe en dyr Intel-cpu og gøre arbejdet i software. I øvrigt syntes vi, at QuickSyncs outputkvalitet var mere end god nok til både bærbare enheder og hjemmebiograf, selvom den nok ikke kan klare blu-ray-disks.

Det er værd at bemærke, at Quick-Sync også kan bruges til at transkode video i farten til at streame indhold trådløst til skærme og mobile enheder eller sågar til lidt hd-videokonference. Det virkelig frustrerende er imidlertid tanken om QuickSync i de små, ultramobile enheder. Vil vi se den finde vej til Atom? Salvator vil endnu ikke ud med sproget. »Alt, hvad jeg kan sige lige nu, er, at det er muligt,« siger han. Det er tydeligt, at han finder tanken fascinerende.

QuickSync er afsindigt hurtig til videokodning. Den er fire gange hurtigere end den bedste Intel-LGA1155-cpu. Den slår endda Nvidia GeForce GTX 680. Det er også fascinerende at se QuickSync i en ultrabook med en Sandy Bridge-cpu med lav spænding. Hvis der er noget skuffende, er det, at QuickSync i sin seneste Ivy Bridge-form kun leverer en smule bedre end Sandy Bridge-udgaven i vores test.

Ifølge Intels Dave Salvato afhænger meget af de pågældende arbejdsbyrder. Jo højere bitrate for output-filen, desto større er svælget mellem QuickSync, som den var, og som den nu er. Vores testbyrde omfatter oprettelse af indhold med lav bitrate til afspilning på smartphones, så det giver mening.

Almindeligt computerarbejde på gpu’en er længe blevet set som pc-ydelsens redning. Vi tvivler på, at det vil ske. Det virker i hvert fald usandsynligt, at det vil ske, som grafikspecialister, herunder Nvidia, har hævdet.

Videokodning og transkodning er argumenterne for at køre software, der ikke er spil, på pc-videokort. Det er derfor vigtigt, at selv de nyeste og største gpu’er får tæv af den beskedne integrerede grafikkerne, Intel putter i sine cpu’er, og af QuickSync-funktionen.

Enkelt udtrykt er Intels QuickSync bedre optimeret til videotranskodning. Det vidner om en fremtid inden for videokodning, der ikke omfatter, at man tvinger opgaven over på enorme 3D-shader-arrays. I stedet vil det hele dreje sig om hardwareacceleration og arkitektonisk optimering.
Naturligvis kan din gpu stadig være hurtigst til videokodning. Men hvis du kører en Sandy Bridge- eller

Ivy Bridge-cpu, og du ikke bruger QuickSync, vil vi varmt anbefale, at du prøver. Den er imponerende. Hvis du ikke har en af disse cpu’er, og du arbejder meget med video, er tiden inde til en opgradering.

Videokodning/konvertering
ArcSoft TotalMedia ShowBiz 5
Badaboom
Corel Digital Studio 1.8
CyberLink MediaEspresso v&.5 & MediaShow v6
Daum Pot Encoder 2.1.4.50 beta
GOM Video Converter
Tencent QQ Player 3.2

Videoredigering
CyberLink PowerDirector* 10 & PowerProducer 5.5
GpPro CineForm Studio
Sony Vegas Pro 11
VideoWave i Roxio Creator

Realtids-videostreaming
ArcSoft LogOn and Link
CyberLink PowerDVD
GOM Player
KMPlayer v3.2
Oovoo