06. maj 2019

Analyse: Rå data skal knække verdens problemer

De seneste års eksplosive vækst i data skal bruges til at gøre verden bedre, mener FN. Det bliver en svær balancegang, for sporing af millioner af menneskers daglige færden kan også bruges til politisk kontrol.

Visualisering af fly i luften over Europa. Foto: CCBY NATS - UK Air Traffic Control

Både i Danmark og i andre lande er vi begyndt at trække meget lange dataspor efter os, uden at vi mærker det. Disse data indeholder masser af viden, og viden er som bekendt magt. Den samlede mængde af registrerede data i verden er på få år eksploderet og forsætter med at stige enormt hurtigt. Ifølge nye tal fra analysevirksomheden International Data Centre forventes den totale mængde af data i verden at blive mere end femdoblet de næste seks år, til 175.000 milliarder gigabytes i 2025.

Tallet er fascinerende enormt, men hvert enkelt registrerede datapunkt ser umiddelbart ret kedeligt ud: For eksempel, at en mobiltelefon bevægede sig fra en mobilmasts område til et andet. Eller at et supermarked solgte seks dåseøl tirsdag formiddag. Det kræver supercomputere at finde mønstre i dyngerne af tilsyneladende ligegyldige informationer, men så er gevinsten til gengæld til at tage og føle på.

Private virksomheder var de første til at se mulighederne i at beherske data, og det handler ikke kun om internetgiganter som Google og Facebook. For eksempel begyndte danske Vestas i 1990 at høste data fra vindmøller. Det er ikke til at se det udefra, men i dag har hver vindmølle op mod tusind sensorer, der konstant måler temperatur, omdrejninger og andre data. Hvert sekund høster virksomheden på den måde 50 millioner datapunkter fra deres 35.000 vindmøller verden over.

Alle disse data bliver gemt, og Vestas bruger så tre supercomputere til at dykke ned i havet af rå data for at finde mønstre. For eksempel ved at analysere, hvornår det bedst kan betale sig at skifte hver enkelt reservedel, så møllerne kan få maksimal driftstid.

For virksomhederne handler de mange data selvfølgelig om at tjene penge, men i de seneste år er det blevet tydeligt, at big data også kan gøre en verden til forskel for udviklingsarbejde og kan være afgørende for at nå Verdensmålene for bæredygtig udvikling.

Analyser af, hvem der ringer til hvem på mobilnettet har vist sig at kunne forudsige med 95% nøjagtighed, hvordan personer i en befolkning bevæger sig omkring. Selv i kaotiske situationer, som efter et jordskælv, ligger nøjagtigheden stadig på omkring 85 procent. I Kenya er den slags data blevet brugt til at forudsige rejse- og migrationsmønstre, for at forstå hvordan malaria og andre smitsomme sygdomme spreder sig. Computeranalyser af store mængder sundhedsdata spillede også en vigtig rolle i at bekæmpe ebola, da virusset brød ud i flere lande i Vestafrika.

Vi står nu midt i en data-revolution, mener FN, som derfor er begyndt at indsamle og bruge langt mere data i sit arbejde. Den internationale organisation har oprettet en særlig afdeling ved navn Global Pulse, der laver konkrete dataløsninger for at bidrage til Verdensmålene for bæredygtig udvikling. Afdelingen har tre innovationslaboratorier, i Indonesien, Uganda og USA, og der er stigende efterspørgsel efter deres teknologi.

Blandt de seneste projekter fra Global Pulse er et system til automatisk analyse af satellitbilleder, hvor man for eksempel lynhurtigt kan tælle antallet af telte og bygninger i en flygtningelejr. Der er planer om at opgradere systemet til også at kunne holde styr på skaderne efter oversvømmelser og at kunne registrere, hvis kulturelle bygninger bliver beskadiget, som da Islamisk Stat sprængte gamle templer i Irak og Syrien i luften.

Mere kontroversielt er det såkaldte Qatalog, som er et computersystem, der automatisk scanner kommunikation på sociale medier og endda opfanger, hvad der siges i radioudsendelser. Programmet udtrækker, analyserer og visualiserer, hvad der optager folk for tiden, og der er planer om at opgradere Qatalog-systemet i år, så det kan inddrage data fra endnu flere kilder.

Den slags oplysninger vil for eksempel kunne bruges til at forudsige et kommende folkemord. I flere år før den enorme massakre i Rwanda i 1994 blev der udsendt propaganda, hvor mennesker fra Tutsi-stammen blev kaldt kakerlakker og slanger, der skulle udryddes. Ved at scanne medierne for den slags kodeord kan man få et tidligt varsel, før katastrofen sker.

 Selvom de mange eksempler på dataløsninger kan gøre stor nytte, kan de også føre problemer med sig. FN lægger stor vægt på, at brugen af data skal ske på en ansvarlig måde. Men det er et åbent spørgsmål, om man både kan skride ind mod hadefuld tale og på den anden side sikre ytringsfriheden. Det er på få år blevet en realitet, at verdens lande nu er i stand til at indrette overvågningssamfund, som tidligere kun fandtes i science fiction.

Især Kina vækker bekymring. Der er nu langt over en milliard kinesere, men der er kun ét parti, der sidder på al magten i landet. Til gengæld har kineserne nu opsat over 170 millioner højteknologiske overvågningskameraer, og i løbet af de næste tre år forventes der at blive installeret yderligere 400 millioner. Kameraerne scanner og analyserer automatisk alle, der bevæger sig på offentlige steder, og systemet genkender ansigter og registrerer højde, køn og etnicitet. Information om hver person kan krydstjekkes med andre oplysninger, som nummerplader og hvem personen mødes med.

Ifølge de kinesiske myndigheder har lovlydige borgere intet at være bange for. Men FN ønsker alligevel at sætte nogle retningslinjer for, hvordan verdens lande kan bruge data på en måde, der sikrer det enkelte menneske mod statens magt. Det bliver ikke let. Selv, hvis et land ønsker at sikre anonymiteten, er metoderne til at analysere data er blevet så effektive, at det i nogle tilfælde gør det muligt at identificere en person, selvom oplysninger som navn og adresse er fjernet. Det skyldes, at data indsamlet over lang tid om en persons færden i hverdagen indeholder dybe mønstre af adfærd.

Derfor bliver det afgørende, hvordan verdens lande vælger at bruge deres datakraft.

Ifølge nye tal fra analysevirksomheden International Data Centre forventes den totale mængde af data i verden at blive mere end femdoblet de næste seks år, til 175.000 milliarder gigabytes i 2025.

Mere kontroversielt er det såkaldte Qatalog, som er et computersystem, der automatisk scanner kommunikation på sociale medier og endda opfanger, hvad der siges i radioudsendelser. Programmet udtrækker, analyserer og visualiserer, hvad der optager folk for tiden, og der er planer om at opgradere Qatalog-systemet i år, så det kan inddrage data fra endnu flere kilder.

170 millioner

Så mange højteknologiske overvågningskameraer findes på nuværende tidspunkt i Kina. Hvor dataindsamlingen kan bruges til gode formål, såsom at hjælpe med at opnå Verdensmålene, så kan dataophobningen også anvendes til at kontrollere borgere. Det er tilfældet i Kina, hvor kameraerne kan genkende ansigter på alle, der bevæger sig i det offentlige rum.