Artikel top billede

(Foto: Computerworld)

Nu går computeren helt DNA

Med computerens hjælp kan vi ikke bare analysere vores individuelle arvemasse, men også lagre data i DNA og udprinte kunstigt DNA. Der er også fungerende prototyper på biologiske DNA-computere. Kort sagt: DNA og computere er nu tæt forbundne.

Af Palle Vibe, Alt om Data

Denne artikel er oprindeligt bragt på Alt om Data. Computerworld overtog i november 2022 Alt om Data. Du kan læse mere om overtagelsen her.

Menneskets samlede arvemasse, DNA’et, består af 20.500 gener, der i alt indeholder 3 milliarder basepar. Rækkefølgen eller sekvensen af baseparrene udgør koden for, hvordan vi er bygget op, og hvilke egenskaber vi har – men også hvilke fejl og skavanker, der er til stede i vores arveanlæg. Ved at aflæse eller ”sekventere” denne rækkefølge kan særlige DNA-læsere afsløre en hel del om os og eksempelvis afdække vort genetiske ophav og vore slægtskabsforhold, afsløre de rigtige forældre i en faderskabssag eller ligefrem finde den eneste ene til os.

Fra opdagelsen af DNA’ets opbygning tilbage i 1953 har videnskaben drømt om at kunne aflæse DNA-koder som en åben bog. Men de første sekventeringsmaskiner fra blandt andet det amerikanske firma Pacific Biosciences var flere meter lange og kostede adskillige millioner, så bare tanken om at tage dem med ud på arkæologiske udgravningssteder eller andre steder for at undersøge eventuelt bevarede fortidsgener var urealistisk. Desuden var fejlraten stor, og bare en forbikørende lastbil kunne forårsage så stor usikkerhed, at udlæsningen måtte startes forfra. Omkring år 2000 kunne de meget udbredte Next Generation-maskiner fra firmaet Illuminas kun kortlægge 36 basepar ad gangen.

Selv DNA-printere til professionelt brug har nu fået en størrelse og form, der minder om almindelige tekstprintere. Denne er fra SGI-DNA. Selv DNA-printere til professionelt brug har nu fået en størrelse og form, der minder om almindelige tekstprintere. Denne er fra SGI-DNA.


Hurtigere end Moores lov
Siden har teknikken udviklet sig voldsomt – hurtigere end den kendte Moores lov for computerprocessorer – og allerede for otte år siden kunne man som almindelig forbruger få kortlagt rækkefølgen eller sekvensen af baseparrene i sit DNA, hvis man indsendte en spytprøve. Det var imidlertid ingen billig fornøjelse, og der var stadig tale om en meget begrænset analyse, idet kun omkring 600.000 basepar blev gennemgået ud af de 3 milliarder. Men nu kan de nyeste sekventeringsmaskiner eller ”DNA-læsere” sekventere et komplet genom fra et menneske eller dyr på få timer for en pris, der hele tiden er på vej ned.

Et eksempel på en nutidig sekventeringsmaskine er MinIon fra det britiske firma Oxford Nanopore. Maskinen er ikke større end en forvokset USB-dongle og tilsluttes uden videre en almindelig bærbar computer. Det åbner for en strøm af helt nye muligheder. Fødevarekontrollen kan nu have en DNA-læser med ud ved mistanke om sygdomsbakterier, ligesom lægeklinikker nu er i stand til at undersøge for arvelige sygdomme på stedet, og biologer på feltarbejde kan DNA-sekventere bevarede organismer med det samme.

MinIon kan tilmed producere ”reads” (sekvenser af afkodet DNA) i længder på mellem 5000 og 10.000 basepar, hvilket er en anselig fordel, når de forskellige reads bagefter skal sammenstykkes til én lang kode. Det er jo noget lettere at samle et puslespil med 10 store brikker end med 1000 små.

DNA kan gemme data
Da den komplette opskrift på vores opbygning, udseende og karakter ligger gemt i DNA-kode i hver eneste af vores kropsceller, er det oplagt, at DNA kan rumme nærmest ufatteligt store datamængder. Og det kan vi have god brug for. Dataforskere har beregnet, at den samlede datamængde, der ligger i ”skyen” i dag, overstiger tre zettabyte. Det er 3000 exabyte, og der går én milliard gigabyte på en exabyte.

Det Teknologiske Institut i Schweiz har imidlertid for nylig påvist, at ét enkelt gram DNA potentielt kan rumme helt op til 455 exabyte data. Det betyder, at skyens samlede datamængde mageligt kunne kodes ind i en teskefuld DNA. Samtidig kan DNA-materiale holde sig uforandret i tusinder af år, blot opbevaringsstedet er mørkt, tørt og køligt, og ingen kender endnu reelt grænsen for materialets holdbarhed – DNA er faktisk blevet trukket ud af en 60.000 år gammel mammut. DNA-lagret information behøver heller ingen tilførsel af energi for at bevare sine data.

Sådan kan en DNA-computer muligvis komme til at se ud i praksis, hvor skærmen viser såvel DNA-strengene som de kemiske reaktioner, der foregår i computerens ”indbyggede” kemiske laboratorium. Sådan kan en DNA-computer muligvis komme til at se ud i praksis, hvor skærmen viser såvel DNA-strengene som de kemiske reaktioner, der foregår i computerens ”indbyggede” kemiske laboratorium.


Lagrede berømt tale
Blandt de første, som det lykkedes at kode DNA, så arvekoden kan opbevare computerbits, var et forskerteam fra det Europæiske Institut for Bioinformatik i England, der i januar 2013 lagrede en mp3-optagelse med et uddrag af Martin Luther Kings berømte tale “I have a dream”, en PDF-udgave af en afhandling om DNA, 154 digte af William Shakespeare, et jpg-billede i farver og beskrivelsen af det computerprogram, der skabte DNA-filerne.

Først omsatte forskerne materialet til HTML-kode (bestående af nuller og ettaller), som blev kodet ind i DNA, hvor hvert basepar kan lagre to bit data, sådan at baseparrene A og C kom til at repræsentere nullerne, mens baseparrene G og T udgjorde ettallerne. Ud fra dette materiale skabte man DNA-sekvenser mærket med en adresse, der henviste til de steder i materialet, sekvensen stammede fra. Yderligere blev sekvenserne arrangeret, så de overlappede hinanden en smule og derfor kunne krydstjekkes mod hinanden. Samtlige sekvenser blev derpå udskrevet med en DNA-printer og igen sekventeret med en DNA-læser.

Denne sekventering blev gentaget tusinder af gange, og alle kopierne blev sammenholdt med hinanden for at modvirke fejl. Sekvenserne blev derpå omsat til den oprindelige digitale version igen, og det skete med en fejlrate på kun to fejl for hver million bit. I alt blev 739 kB binære data på den måde indkodet og udlæst igen fra en DNA-streng på størrelse med et støvgran.

Men for nylig har et forskerhold fra det amerikanske Harvard universitet lagret omkring 700 TB data i et enkelt gram DNA. Den største hindring endnu er prisen. Det koster for nuværende i omegnen af 12.400 dollar blot at lagre en enkelt megabyte data, hvilket rundt regnet er en million gange dyrere, end hvad det koster at gemme en tilsvarende mængde magnetiske data på en båndstation. Det lagrede materiale skal jo også kunne aflæses igen, og her er prisen med den nuværende teknologi omkring 220 dollar pr. megabyte. Men også den pris vil formentlig kunne bringes ned på et mere realistisk niveau inden for 10-20 år, og til sammenligning er behandling af DNA alene gennem de sidste ni år blevet en million gange billigere, og den slags prisfald kan ikke engang den elektroniske udvikling hamle op med.

De nyeste læsere fra specialfirmaet Illumina sekventerer DNA-strenge hurtigere og er derfor langt mere rentable end nogen tidligere modeller. De nyeste læsere fra specialfirmaet Illumina sekventerer DNA-strenge hurtigere og er derfor langt mere rentable end nogen tidligere modeller.


DNA-printere kan sortere
De DNA-printere, der udskriver DNA, udskriver ikke rigtigt DNA, men sprøjter kunstige DNA-molekyler ud på tynde glasplader. Molekylerne består af små dråber med den præcise blanding af A-T og G-C basepar. Hver dråbe udgør én DNA-sekvens. Indtil videre er DNA-printere kun i stand til at producere relativt korte DNA-strenge. Desuden kan de udprintede DNA-sekvenser meget nemt blive brudt op i endnu mindre vildfarne stykker, og det betyder naturligvis en høj fejlrate. Men det betyder også, at denne kunstige DNA ikke vil kunne aflæses af levende celler. De vil simpelt hen udstøde det kunstige arvemateriale, hvorved man i praksis stadig undgår science fiction-agtige væsner med omkodede kropsceller.

Men en ny type DNA-printer fra producenten Cambrian Genome kan måske ændre på sagen. Selv betegner producenten printeren som en slags DNA-sorteringsmaskine. Den kan nemlig også hurtigt finde og samle de ønskede kunstigt fremstillede DNA-stykker til ekstremt lange DNA-strenge. Det skræddersyede DNA-materiale sælges til kunden som regulær metervare omend i en høj prisklasse, for denne type DNA er stadig utrolig kostbar. Bare genomet for en simpel bakterie vil det koste over 5 millioner kr. at printe ud med kunstigt DNA.

Computeren regner med DNA
Men det er også muligt at bruge DNA-molekyler og biologiske computer-kredsløb til at foretage beregninger og dermed fremstille en DNA-baseret computer.
To amerikanske forskere fra det tekniske universitet Caltech i Californien har opbygget en sådan fuldt fungerende DNA-computer, der kan udregne kvadratrødder med 4-bit beregninger.

Computeren består grundlæggende af en beholder med en væske tilsat kunstige DNA-strenge, hvis rækkefølge af basepar er specielt tilpassede den aktuelle regneopgave og kan parres med forskellige molekyler og derved skabe logiske ”and”- og ”or”-gates. Molekylerne konkurrerer om parringen, og jo flere molekyler af samme slags, jo større er chancen for, at de vil erstatte startmolekylet, hvilket så vil kunne udlæses som et output. Når begge gates er off, er output lavt. Det er højere for en off-on situation (”or”) og højest for en on-on situation (”and”).

Det relativt enkle biologiske parrings-princip og muligheden for at bruge flere forskellige typer biologiske molekyler som input – samt muligheden for at linke output til biologiske processer som eksempelvis genetisk manipulation – gør hele tanken om fremtidige DNA-computere virkelig interessant. De er til gengæld knapt så praktiske, når det kommer til almindeligt regnearbejde, for udregningerne tager sin tid, og en DNA-computer vil i hvert fald indtil videre ikke være effektiv nok til almindelige kalkulationer. Til gengæld kan en DNA-computer uden videre integreres i biologiske systemer og modtage input fra en levende celle og levere output til en biokemisk proces.

Kan slå op i store tabeller
Kinesiske forskere er gået en lidt anden vej og har konstrueret en DNA-computer, som ikke kan regne, men slå op i kæmpetabeller, og det åbner også perspektiver. For ved at foretage sammenligning mellem myriader af DNA-strenge kan sådan en biologisk tabelgransker finde svaret på mange spørgsmål.

Hvis tabellen eksempelvis er en simpel regnetabel, kan computeren finde den streng, der giver svaret 12, fordi den er programmeret til at sammensmelte de to strenge, der indeholder tallene 4 og 3 (4 x 3 = 12). Men hvis man skifter tal ud med indikationer på sygdom, vil DNA-computeren, der er lille nok til at kunne være indeni en celle, kunne slå alarm, hvis to specifikke indikationer på en sygdom er til stede i en persons DNA.

Vores viden om DNA og dermed også vores muligheder for at bruge naturens eget princip til datakodning og datalagring vokser dag for dag, og DNA-teknologien er allerede i gang med at ændre blandt andet hospitalsvæsnet, politiets efterforskning og forskning i nye afgrøder. Men mulighederne vil på den anden side også give os adgang til at genmanipulere os selv og skræddersy vores børn. Kun fremtiden vil kunne vise, om vi vil være i stand til at udnytte disse muligheder med fornuft og respekt.

Sådan fungerer koden for alt levende
DNA indeholder koden for, hvordan alt levende er sat sammen. Koden er opbygget af rækker af fire kvælstofholdige baser betegnet adenin (A), guanin (G), thymin (T) og cytosin (C). Baserne sidder som trin på en lejder mellem to lange strenge, der snor sig om hinanden i en dobbeltspiral og optræder altid parvis sådan, at A altid danner par med T, mens G altid danner par med C.
Det er rækkefølgen af disse fire bogstaver, der udgør ”DNA-sekvensen”, som kan sammenlignes med bogstaver i en tekstlinje eller for den sags skyld rækker af nuller og et-taller i det binære computersprog.

Minisensorer afslører DNA-sekvensen
DNA-sensorer behøver ikke være store. Britiske MinIon arbejder ved hjælp af en ny teknik, der udnytter såkaldte nanoporer som biologiske sensorer, dvs. en kanal på få nanometer i diameter, der gennemtrænger cellers membraner og tillader transport af molekyler og ioner.

Sekventeringsmaskinen fra MinIon er ikke meget større end en almindelig USB-dongle og kan tilsluttes en Windows-pc. Sekventeringsmaskinen fra MinIon er ikke meget større end en almindelig USB-dongle og kan tilsluttes en Windows-pc.

Den kan manipuleres til kun at give fri passage til helt bestemte molekyler. Det kan ske ved simpelt hen at sætte strøm til kanalen og bruge ændringer i spændingen til at afgøre, hvad der passerer gennem den. Eller ved indgangen at anbringe forskellige enzymer, der kun tillader bestemte DNA-molekyler at passere.

Det er også muligt at hæfte en DNA-kode fast ved indgangen til nanokanalen, som kun lader molekyler med matchende kode passere – eller ligefrem både lede DNA-strenge gennem kanalen og samtidig dele dem op i to kæderækker som en lynlås, der åbner sig. Kanalerne kan også skabes kunstigt og samles i et netværk af fordybninger eller ”brønde” på en plade af polymer og på den måde udgøre en slags ”sensorchip”, der ud fra forskellige spændingsforskelle kan udlæse DNA-strenge i realtime.

Ufattelig rummelighed
Et enkelt gram DNA kan i dag kodes med indholdet af 14.000 Blu-ray-plader på hver omkring 50 GB. Samme datamængde lagret traditionelt ville fylde 233 harddiske på hver 3 TB.