Home » Forskning » Maskinintelligens hjælper med at afsløre verdenshistorien
Maskinintelligens hjælper med at afsløre verdenshistorien

Maskinintelligens hjælper med at afsløre verdenshistorien

Share

Britiske forskere har ladet en computer gennemtrawle 35 millioner avisartikler og fået overraskende indsigt i nyere historiske tendenser og strømninger

Almindeligvis kender vi kun vores historie ud fra nedskrevne optegnelser og kilder, der til en vis grad er farvet af de personer, der har skrevet optegnelserne. Dette materiale har så dannet grundlag for den historie, vi har lært i skolen, som så oven i købet igen er påvirket af, hvad forfatterne til disse historiebøger har valgt at samle og tage med, og såmænd også hvilke fortolkninger historielæreren har valgt at uddrage og fremstille som den historiske sandhed. Sagen er jo i virkeligheden den, at intet menneske alene kan danne sig blot et afgrænset billede af historien gennem bare de sidste par hundrede år.

Men kan en computer? I dag kan kunstig intelligens, maskinlæring og kloge algoritmer jo udmærket gennemgå og håndtere myriader af historiske Big Data og finde nye meningsfyldte sammenhænge på tværs.

Et tidligere forsøg, hvor en computer blev fodret med over 5 millioner engelske bogtitler udgivet i de sidste 200 år, har vist, at denne form for historieforskning kan give interessante muligheder. På grundlag af sådan en database på mere end en milliard bogsiders tekst kunne forskeren påvise udviklingen i det engelske sprog og den engelske kultur generelt.

Men der var også kritik med hensyn til kilderne og udvalget, da databasen alene var blevet opbygget af bibliotekstitler (som jo i forvejen var udvalgt af forskellige bibliotekarer) samt eksempelvis tidsskrifter, klubblade osv.

Se også:  Salt er et enestående datalager

Men nu har et forskerhold fra universitetet i den sydvestlige engelske by Bristol fodret en supercomputer med godt 36 millioner artikler fra over 120 lokale britiske aviser, der samlet dækker en periode på 150 år fra 1800-1950, og ladet den foretage en analyse af såvel indhold som sammenhæng. Og det har givet forbløffende spændende resultater og også en langt større viden og indsigt i tiden lige forud for nutiden.

Journalistik og kønspolitik

De artikler, der ikke i forvejen var gemt på mikrofilm, blev scannet med en Zeutschel A0 Sheet-Bed Scanner og omsat til 24-bit TIFF-billeder i farver med en opløsning på 400 dpi, hvorpå de yderligere blev digitalt behandlet, beskåret, renset og forbedret, så udgangspunktet var det bedst tænkelige.

Teksterne blev derpå læst ind i computeren med anvendelse af CCS docWorks OCR-software (Optical Character Recognition), hvorpå teksten blev analyseret af intelligente algoritmer, der eksempelvis kunne gennemskue både forløb, sammenhænge og journalistiske fordomme.

Efter at have tygget sig gennem de næsten 30 milliarder ord i artiklerne fremkom computeren med en komplet statistisk analyse af de omtalte historiske begivenheder, der gjorde det muligt for forskerne at sammenholde, tidsfæste og identificere forløbet og indvirkning af begivenheder som krige og epidemier, historiske og kulturelle strømninger med indslag af både klasseforskelle og kønspolitik.

Se også:  Hej Danmark, hvor smarte er dine byer?

Som eksempel viste den intelligente analyse klart, at betegnelsen “suffragette” primært blev anvendt som blikfang af den mere kulørte tabloidpresse og alene skulle ses i sammenhæng med de britiske kvinders indædte kamp for stemmeret i perioden. Men såvel betegnelsen som de begivenheder, der fulgte i kølvandet, gav kun mening, hvis de blev tolket på baggrund af både den historiske og kulturelle udvikling i almindelighed.

Det var også tydeligt ud fra computerens analyse at påvise politiske ændringer og fremstød foruden tidspunkter og datoer for konkrete begivenheder inden for kongehus og regering samt forskellige videnskabelige og teknologiske opdagelser. Herunder var det særligt interessant for forskerne, at de meget klart kunne udlede og følge opblomstringen og udbredelsen af forskellige nye teknologier og trends.

For eksempel kunne de let spore en pludselig voksende brug af elektricitet på bekostning af brugen af dampkraft. Disse to forskellige op- og nedgangskurver krydsede hinanden i 1898. På samme vis kunne forskerne i analysen tydeligt udlæse, at jernbanen overhalede brug af heste til transport og samfærdsel i 1902, og det er ikke noget, der så klart fremgår af de almindelige historiebøger.

Elektricitetens sejr over dampkraften og jernbanens generelle overtagelse af al transport på bekostning af hesten fremgår åbenlyst af analysen (A+B). Også inden for elektronisk kommunikation kunne forskerne tydeligt følge udbredelsen af telegrafen, telefonen, radioen og ikke mindst fjernsynet i relation til tid (C).

Forskellen mellem omtale af mænd og kvinder (og ordene han og hun) snævres ind, og fremgangen for omtale af kvinder stiger mellem de to verdenskrige (D+E). Skuespillere, sangere og dansere omtales hyppigere efter 1890 (F), mens politikeromtaler tydeligt falder i antal fra starten af det 20. århundrede. Fodbold bliver mere populær end cricket efter 1909 (G).

TAGS
historie
innovation
Kunstig intelligens

DEL DENNE
Share

Seneste Tech test
Seneste konkurrencer

Mest populære
Populære
Nyeste
Tags

Find os på de sociale medier

Modtag dagligt IT-nyhedsbrev

Få gratis tech-nyheder i din mail-indbakke alle hverdage. Læs mere om IT-UPDATE her

Find os på FaceBook

Alt om DATA

Lautrupsgade 7,
DK-2100 København Ø
Telefon: 33 91 28 33
redaktion@altomdata.dk

Datatid TechLife

Lautrupsgade 7,
DK-2100 København Ø
Telefon: 33 91 28 33
redaktion@datatid.dk

Audio Media A/S

CVR nr. 16315648,
Lautrupsgade 7,
DK-2100 København Ø
Telefon: 33 91 28 33
info@audio.dk
Annoncesalg / Prislister:
Lars Bo Jensen: lbj@audio.dk Telefon: 33 74 71 16
Annoncer: Medieinformation


Alt om DATA, Datatid TechLife  © 2019
Privatlivspolitik og cookie information - Audio Media A/S