Artikel top billede

(Foto: Computerworld)

Selvkørende bil: Kig på kortet og kør!

MIT arbejder lige nu på at lære selvkørende biler at finde vej ved hjælp af tre kameraer og et simpelt vejkort.

Af Palle Vibe, Alt om Data

Denne artikel er oprindeligt bragt på Alt om Data. Computerworld overtog i november 2022 Alt om Data. Du kan læse mere om overtagelsen her.

Hemmeligheden bag denne nytænkende teknologi er at gøre selvkørende biler i stand til at sammenholde et almindeligt simpelt digitalt vejkort med en visuel gengivelse af omgivelserne. Og på den måde give dem en mere menneskelignende og intuitiv fornemmelse for, hvor de er i forhold til, hvor de skal hen.

Baggrunden er naturligvis en stille erkendelse af den enorme forskel, der er mellem, hvordan mennesker og computere tackler og løser problemer. Mens vi mennesker ikke har synderligt besvær med at tage et kort ud af handskerummet og se, hvor vi skal hen, og hvordan vi nemmest kommer det, er selvkørende biler normalt afhængige af snesevis af sensorer, kameraer og radarer og lidarer foruden nøjagtige GPS-målinger for at præstere det samme.

Det resulterer alt sammen i voldsomme datamængder, og ved kørsel i en større by kan det let snige sig op over fire TB (terabytes). Og det betyder et behov for tilsvarende enorm computerkraft for at sammenholde disse inputdata med bilens aktuelle position, omgivelser, kørehastighed og manøvrering.

Alt dette gør computernavigation i selvkørende biler kompliceret samt ofte langsom og fejlbehæftet i forhold til, hvor let du selv kan orientere dig alene ved at bruge din erfaring, intuition og sunde fornuft. Du kan eksempel-vis ud fra byggetæthed og hustyper nemt slutte, om du er inde midt i byen eller mere ude i yderkanten, eller du kan såmænd bare følge en jernbane, en hovedvej eller anden tydelig færdselsåre på vej ind i eller ud ad en by.

Den stakkels selvkørende bil skal (i hvert fald til den bliver 100 % autonom) derimod før hver ny tur generere komplicerede 3D-kort, og alligevel skal du sidde konstant årvågen og klar, hvis bilen kommer i en vanskelig, uventet eller risikofyldt situation.

Tre videokameraer og et GPS-kort

Det nye MIT-system bygger derimod på et forholdsvis enkelt end-to-end navigationssystem, der ud fra et simpelt digitalt GPS-kort og data fra tre videokameraer samt en IMU-enhed (Inertial Measurement Unit) kan dirigere bilen hensigtsmæssigt og korrekt hele vejen frem til målet. Systemet kaldes ”Variational End-to-End Navigation and Localization” og arbejder på mange måder som en menneskelig bilist.

De tre kameraer affotograferer konstant vejen foran bilen og dens omgivelser til begge sider, mens data fra IMU-enheden, der er en sammenbygning af accellerometre, gyroskoper og undertiden også magnetometre, giver besked om bilens retning og orientering.

Hjernen i systemet er en speciel maskinlæringsalgoritme, et såkaldt ”convolutional neural network” (CNN) af den type, der normalt bruges til billedgenkendelse og derfor er særligt egnet til at analysere visuelle indtryk og sammenholde dem med andre data (i dette tilfælde et simpelt digitalt vejkort).

Sådanne enkle GPS-kort fylder ikke alverden og kan derfor let hentes ind og analyseres på farten. Faktisk vil et GPS-kort, der dækker alle lande i verden, ifølge MIT kun fylde omkring 40 gigabyte og kan derfor sagtens ligge permanent i en database i bilcomputeren.

Bilen kan naturligvis også, som det gælder andre GPS-navigationsanlæg, klare sig et stykke uden GPS-data og opretholde sin kurs, selv om den kører inde i tunneller, P-huse og lignende. Informationerne fra kameraer og IMU vil her yderligere sikre, at algoritmen alligevel nemt kan danne sig en præcis opfattelse af bilens position og holde styr på ruten og bilens manøvrering.

Ingen maskinlærings-algoritme er imidlertid født med viden om billeder eller bilkørsel. MIT brugte derfor først tusindvis af mandetimer på at træne algoritmen ved at lade en menneskelig chauffør gennemkøre kilometervis testruter (der i forvejen var godkendt til selvkørende biler) i en Toyota Prius, der havde fået indbygget de nævnte sensorer. På den måde tilegnede bilcomputeren sig efterhånden en god ide om, hvordan bilen skulle manøvrere i så mange forskellige færdselssituationer som praktisk muligt.

I eksempelvis et T-kryds kan en bil dreje til højre eller til venstre eller vende. Den kan for så vidt også køre ligeud, men det lærte systemet hurtigt, at der ikke er nogen menneskelig chauffør, der gør. Og til hvilken side, den så skulle dreje, afhang alene af målet.

På den måde lærte algoritmen at styre bilen trygt og hensigtsmæssigt på såvel hovedveje, motorveje, gaffelforgreninger, tilkørsler, frakørsler og vejkryds som rundkørsler og foretage fornuftige manøvrer i tvivlssituationer uden at være specielt oplært i ruten på forhånd. Kan bilen ikke umiddelbart overskue et færdselsproblem, vil den holde stille eller forsigtigt køre ind til siden.

MIT har jo ikke designet systemet til 100 % autonome biler, selv om sådanne også vil kunne gøre god brug af den grundlæggende ide med at parre visuelle data med udseendet af et simpelt digitalt. Systemet kan ovenikøbet gennemskue uoverensstemmelser mellem kort og kamerabillede, så hvis GPS-kortet til eksempel fortæller, at vejen snor sig og deler sig, selv om den i virkeligheden bare fortsætter ligeud, vil algoritmen konkludere, at den nok bør stole mest på videobillederne og vil manøvrere bilen derefter.

Det nye system er designet til at sammenligne videobilleder af vejens forløb og beskaffenhed med et skematisk GPS-kort, der angiver målet og den overordnede rute.

Ser efter afstribning og vejtavler

Daniela Rus, der er direktør for Computer Science and Artificial Intelligence Laboratory (CSAIL) under MIT og har været medudvikler af Variational End-to-End Navigation and Localization, forklarer, at når en selvkørende bil alene ved at analysere videobilleder af omgivelserne og sammenholde dem med et vejkort, kan afgøre, hvor den er, vil den også kunne køre sikkert gennem ukendte bymiljøer og landskaber, skove, bjerge osv.

Daniela Rus pointerer også, at MIT-algoritmen kan tage bestik af visuelle markeringer som vejstriber, hajtænder mv. til at afgøre, hvilken slags veje, den kører på, og hvad den derfor mest sandsynligt vil kunne komme ud for. Den intelligente algoritme kan også bide mærke i advarselstavler, lyskurve og lignende og reagere forsigtigt og korrekt.

Ganske vist vil sensorer altid kunne fejle og levere gale inputs, men MIT-navigationen er udlagt, så bilen bliver på den sikrest mulige bane, kurs og hastighed, hvis den modtager afvigende inputs. Og da den straks vil opdage uoverensstemmelser mellem kortdata og de reelle vejforhold og rette ind, vil den også generelt være relativt upåvirkelig af datastøj, elektroniske fejl og andre mistolkninger.

Variational End-to-End Navigation and Localization system gør det med andre ord (i hvert fald i teorien) overflødigt at træne en selvkørende bilalgoritme på enhver tænkelig vej og udfærdige lange og indviklede programinstrukser. Den vil være i stand til at manøvrere hensigtsmæssigt på veje og ruter, den aldrig har ”set” før”, og netop fordi systemet forud er blevet trænet af en menneskelig chauffør, vil det også afspejle en menneskelig bilists rationelle og etiske eller endog ”moralske” køreadfærd og reaktioner i vanskelige køresituationer. Se en video af Variational End-to-End Navigation and Localization systemet i funktion: https://youtu.be/aXI4a_Nvcew