Slik måles vitenskapelig fremskritt

Lesetid: 9 minutter

“Sannhet” og “objektivitet” er uklare ord som ofte forutsettes når vi snakker om vitenskapelige fremskritt. Likevel kan teoretiske modeller måles mot hverandre for å si hvilken som er sannest, og teknologisk utvikling gjør at vi har bedre kontroll på virkeligheten enn noensinne.

Datamodeller er grunnlag for vitenskapelig teori

En vitenskapelig teori beskriver bilder eller modeller av verden. Den beskriver matematiske representasjoner av virkeligheten. Dine forestillinger om verden er strengt tatt noe annet enn virkeligheten selv – du kan jo forestille deg det aller meste. Vitenskapelige teorier er på samme måte også noe annet enn virkeligheten selv.

Men det du forestiller deg kan også være riktig, eller sant. Det kan være noe i din forestilling som samsvarer med verden der ute. Slik er det også med vitenskapelige teorier. Når disse er gode, samsvarer teoriene våre godt med virkeligheten, med verden der ute. Når det er fullstendig overlapp, kaller vi teoriene sanne.

Vi får tak på virkeligheten gjennom eksperimentell vitenskap, som helt generelt innebærer forskjellige typer målinger. Måleteori og eksperimentell design gir oss representasjoner av hvordan verden er, såkalte datamodeller – beskrivelser som er så nær virkeligheten som vi kan komme.

Vi kan gi et eksempel med himmellegemenes mekanikk og astronomi. Teoriene våre forteller hvordan planeter med forskjellige masser beveger seg, gitt de andre planetenes masser, posisjoner og fart i forhold til hverandre. Vi beskriver abstrakte modeller, og vi kan svare på spørsmål om disse systemene av legemer ved å studere disse modellene.

For så å gjøre disse modellene, og hva de forteller oss, relevante for vår virkelighet, holder det ikke å se på teorien, vi må supplere med empiri. Gjennom bruk av astronomiske observasjoner og målinger kan vi finne antall planeter, deres masse, fart og posisjon som gjelder for et virkelig planetsystem.

Denne modellen av virkeligheten og virkeligheten selv må samsvare nøyaktig for at dette skal være en en god vitenskapelig teori. Et samsvar også av videre observasjoner og målinger med de forventninger teorien forteller oss.

Med virkeligheten mener jeg den empiriske virkeligheten. Verden der ute. Fra subatomære partikler, til biologiens celler og populasjoner, menneskene du til daglig møter, økonomiske transaksjoner, astrofysikkens supernovaer og kvasarer. Hele kosmos.

Vi har dermed to typer modeller

  • På et høyere nivå har vi vitenskapelige teorier og deres teoretiske modeller. De teoretiske modellene er som i eksempelet vårt abstrakte og generelle “planetsystemer”.
  • På et lavere nivå har vi eksperimentell vitenskap og deres datamodeller. Som i eksempelet vårt ville være datamodeller av vårt observerte planetsystem.

Begge disse modelltypene er matematiske forestillinger. I kraft av deres matematiske natur kan de beskrives og håndteres på helt nøyaktige og objektive måter. Vi kan derfor undersøke hvor godt de samsvarer med hverandre.

Når vi undersøker hvor godt teori- og datamodeller samsvarer, er det ikke så viktig hva det er de er ment å beskrive. Det er viktigere hvordan de gjør det, nemlig deres struktur. Nøkkelen skal passe perfekt i låsen. For her kommer det viktige: Denne overensstemmelsen mellom teorimodeller og datamodeller betyr at det er noe ved våre vitenskapelige teorier som griper selve virkelighetens struktur.

Oppfører vårt målte planetsystem seg nøyaktig som våre teorimodeller foreskriver? I så fall har vi ved teorien vår klart å gripe virkelighetens struktur.

Nå som vi har sett hva en vitenskapelig teori er, kan vi gå videre og se på hvordan vi kan snakke om hvor sterke forskjellige teorier er. Vi har to slike styrkemål:

  1. logisk styrke
  2. empirisk styrke

Logisk styrke

Dette styrkemålet tilhører vitenskapelige teorier og er et mål på den mengden modeller teorien beskriver. Jeg skal forsøke å forklare dette mer intuitivt.

Vi kan se på teorier som en samling regler om, og forklaringer eller definisjoner på, et eller annet. En teori sine modeller er alle de modellene vi kan beskrive som stemmer overens med disse reglene, forklaringene og definisjonene. Modellene som lystrer beskrivelsene.

Styrkemålet forholder seg slik: jo sterkere teori, desto færre modeller. Dersom du legger til en regel, så blir det enda vanskeligere for en modell å oppfylle kravene. En teori som sa “hva som helst kan skje”, ville være en ytterst svak teori. Som Karl Popper ville sagt det, en teori som kan forklare hva som helst, forklarer ingenting: En teori sin styrke ligger dels i det den utelukker.

I masteroppgaven gir jeg et slikt eksempel på økning i logisk styrke. Vi ser da på to forskjellige teorier for Newtons mekanikk, en med absolutt rom og en med relativt rom, og viser at Newtons mekanikk med relativt rom (Galileisk tidrom) er den logisk sterkere teorien. Planetbanene begge teoriene foreskriver samstemmer perfekt, både med hverandre og med de relevante observasjonene (datamodellene). Men denne absolutte forstanden av rom gjør ingen empirisk forskjell, og gjør teorien derfor svakere ved å postulere mer enn den trenger for å forklare empirien.

Det ville ikke være særlig informativt å ta en hvilken som helst teori og vurdere dens styrke ved å se på dens mengde modeller. Det blir først informativt når man sammenligner disse mengdene til forskjellige teorier. Enda mer informativt blir det når man sammenligner forskjellige teoriers modellmengder opp i mot en gitt mengde datamodeller, og ser hvor godt hvert av modellparene samsvarer. Da er vi inne på vitenskapelig fremskritt. Men først må vi se på den korresponderende styrken til datamodeller.

Empirisk styrke

En vitenskapelig teori må kunne forklare det datagrunnlaget som foreligger. Vi kan tenke oss at ifølge teorien vår burde dataen være annerledes. Teorien er da feil. Eller det kan være data vår teori ikke sier noe om, men burde sagt noe om. Teorien vår er da ufullstendig.

En vitenskapelig teori sin empiriske styrke er et mål på den mengde informativ data som er representert i mengden datamodeller teorien samsvarer med.

I masteroppgaven gir jeg også et eksempel på en økning i empirisk styrke. Økt rekkevidde av en målevariabel, som fremviser ny og informativ data, resulterer i at Einsteins spesielle relativitetsteori har en empirisk styrke større enn Newtons mekanikk. Noe som jo ikke er overraskende. Men en teori om vitenskapelig fremskritt bør kunne vise det.

Nærliggende spørsmål blir da: Hvordan varierer mengden informativ data i våre datamodeller, og hvordan kan vi hensiktsmessig måle denne mengden?

Mer data er alltid et gode for vitenskapen, og her er teknologisk nyvinning behjelpelig. Som nevnt ovenfor er eksperimentell vitenskap målinger. Med forbedret teknologi økes rekkevidden, presisjonen og oppløsningen til dataene gitt oss ved hjelp av måleinstrumenter. Datamaskinene brukt til å prosessere denne informasjonen blir også stadig kraftigere. Ny teknologi gir høyere presisjon, men ikke nødvendigvis mer data enn det som var tilgjengelig. Høyere presisjon kan absolutt være viktig for å stadfeste vitenskapelig fremskritt. Men det er alltid mengden informativ data som styrker datamodellen og derfor teoriene.

Vi kan se på et tilfelle der mengden informasjon ville ha øket. Med stadig bedre instrumenter for å observere himmellegemene, kunne man etterhvert altså måle planetenes baner med en langt større presisjon. Slik oppdaget man at Merkurs planetbane var annerledes enn forventet. Selve ellipsen Merkur fulgte roterte, noe som ikke burde vært tilfellet gitt Newtons teori. Kunne tilstedeværelsen av en ikke-oppdaget planet forklare dette? Man trodde en stund det, men fant ingenting. Man oppdaget etterhvert at denne rotasjonen av ellipsen ikke bare gjaldt Merkur – noe som hadde vært veldig merkelig, siden fysikkens lover er universelle – men faktisk gjelder alle planeter. Men for de andre planetene gjaldt dette i en så liten grad at man fram til da ikke hadde hatt presise nok måleinstrumenter. Einstein regnet således ut at ifølge hans generelle relativitetsteori var dette akkurat som forventet.

Inntil man hadde presise nok måleinstrumenter til å registrere dette systematiske avviket, øket ikke datamengden ved økt presisjon. Men i det man fikk registrert dette, økte den empiriske styrken.

Utfordringen ved å skille informativ data fra resten, er tilsvarende problemet å skille et signal fra støy.

Støy er det som matematisk sett er helt tilfeldig. Støy er, eller indikerer, ingenting.
Et signal er ordnet. Et signal er, eller indikerer, noe.

Fra informasjonsteori og -teknologi har vi et helt arsenal av verktøy til å skille signaler fra støy. Eller tilsvarende: Skille informativ data fra resten.

Verktøyene til å fjerne irrelevant informasjon fra data er kompresjonsalgoritmer. Dette er programmer eller prosedyrer som komprimerer dataene – tenk en zip-fil. Gitt enhver datamengde, så finnes det en mest mulig komprimert beskrivelse. Og det finnes et nøyaktig og objektivt mål på denne komprimerte datamengden, gitt av lengden av denne beskrivelsen.

Vi ser da hvordan en, for eksempel, økning i presisjon på en måling ikke nødvendigvis øker mengden informativ data. Det hjelper ikke ha høyere oppløsning på en skjerm som viser en kanal med bare støy. Programmer som komprimerer fjerner altså det overflødige.

Heretter vil vi forutsette at alle mengder datamodeller vi tar hensyn til, er blitt komprimert på denne måten. Slik sett har de all relevant informasjon, men heller ikke mer informasjon enn nødvendig.

Vi er da klare for å definere empirisk styrke. Den empiriske styrken til en vitenskapelig teori er målet på den (maksimalt komprimerte) datamengden til de datamodeller som samsvarer med teorimodellene. Med andre ord, rett og slett et mål på den mengde relevant data en teori kan forklare.

Nå som vi har både logisk styrke og empirisk styrke på plass, kan vi gå videre til spørsmålet om fremskritt.

Vitenskapelig fremskritt

Vitenskapen etterstreber å øke logisk og empirisk styrke i størst mulig grad. Logisk styrke, har vi sett, begrenser mengden teoretiske modeller som beskrives av en vitenskapelig teori. På samme måte som vi, når det gjaldt datamodellene, ville inkludere all den informative dataen, men ikke mer, gjentas denne logikken nå på et høyere nivå.

En vitenskapelig teori må beskrive modeller på en innholdsrik nok måte til å kunne forklare dataene. Det vil si, teorimodellene må være tilstrekkelig innholdsrike til å kunne samsvare med datamodellene. Men samtidig skal da ha minst mulig innhold utover det. De må si nok, men så lite utover det som mulig. Dette er fordi empirisk belegg er den eneste grunnen til å tro noe som helst om virkeligheten.

Et eksempel på fremskritt ved økning i logisk styrke: Vi har en teori med en viss logisk styrke, som samsvarer med en viss mengde datamodeller fordi den forklarer empirien. En ung genial teoretiker tenker så ut en ny teori som kan forklare akkurat den samme empirien, men på en enklere måte.

Oversatt til vår terminologi så vil dette bety at den nye teorien er logisk sterkere. Den postulerer mindre, rent teoretisk, men kan likevel forklare det som må forklares. Dette er ensbetydende med at den gamle teorien postulerte noe som faktisk ikke var nødvendig for å forklare den relevante empirien. Denne økningen i logisk styrke kan demonstreres matematisk ved å vise at den nye teorien beskriver eller tillater færre modeller enn den gamle.

En økning i empirisk styrke er mer intuitivt enn logisk styrke. La oss si vi innenfor et forskningsområde oppdager et nytt fenomen. Enten så samsvarer datamodellene, som inneholder dette nye fenomenet, med vår per nå beste teori, eller så gjør den det ikke. Gjør den det, øker denne teoriens empiriske styrke. En økning tilsvarende kompleksiteten til beskrivelsen av det nye fenomenet. Konstruerer vi en ny teori som samsvarer med de nye dataene, så utgjør den på samme måte, og av samme grunn, en økning i empirisk styrke relativt til den gamle teorien.

Den generelle formen på vitenskapelig fremskritt er da som følger. Vi har en sikksakk-bevegelse fremover bestående av økninger i logisk og i empirisk styrke. Empirisk styrke er den informasjonen om virkeligheten våre vitenskapelige teorier kan forklare. Denne styrken økes ved at vi kan gjøre målinger med bedre instrumenter, vi finner nye steder å rette instrumentene mot, eller vi har kanskje latt våre målinger dikteres av feil type spørsmål.

Teoretikernes oppgave er mer subtil. For ikke bare skal teoriene forklare empirien. Andre relevante spørsmål kan melde seg. Iblant kan ulike teorier forklare det samme. Hva har de til felles? Er de egentlig forskjellige versjoner av en mer generell teori? Hvilken er den logisk sterkeste?

Logisk styrke økes ved å finne teorier som forklarer empirien på en måte som sier minst mulig om verden utover det vi har empirisk belegg for. Parallelt med at den empiriske styrken til vitenskapelige teorier øker ved at de kan forklare nye og flere fenomener, økes den logiske styrken ved at man kutter ned på teoriene (selv om de vokser på andre måter); man fjerner overflødig teoristruktur, slik at teoriene er så presise og så sannferdige som mulig.

Litt historisk og sosial kontekst

På nittitallet raste en debatt om disse spørsmålene, kalt vitenskapskrigene. Vitenskapsmenn fra realfagene beskyldte innflytelsesrike akademikere fra sosiologien og humaniora, postmodernistene, for å undergrave det vitenskapelige prosjekt ved å hevde at objektiv kunnskap ikke er mulig.

Postmodernistene bedrev det som bredt kalles kritisk teori og utsatte vitenskapelige teorier og selve den vitenskapelige institusjonen for maktkritikk, både med tanke på rase, kjønn og økonomiske forhold. Deres spørsmål i ytterte konsekvens er:

“Opprettholder vitenskapen den hvite, vestlige manns undertrykkende hegemoni ved hjelp av såkalt vitenskapelig metode og resultater?”

Et ekstremt eksempel på denne virkelighetsfornektelsen er den franske feministen og kulturkritikeren Luce Irigaray som fordømte Einsteins formel E=mc² som sexistisk. En formel som på en nonchalant måte privilegerte lysets hastighet over mer feminine hastigheter.

Et forsvar for virkeligheten

Denne tvilen på muligheten av objektiv kunnskap og grunnleggende skepsis mot vitenskapen er ikke bare feilaktig, men også farlig. Vi trenger kunnskap for å forbedre vår situasjon i verden, og vitenskap er vår eneste kilde til kunnskap. Selv postmodernisten Latour har erkjent at denne tvilen er svært kontraproduktiv – noe han nevnte i forbindelse med at klimaskeptikere bruker nettopp deres egne “kritiske” argumenter for å betvile menneskeskapte klimaforandringer.

Masteroppgaven min kan anses som et vitenskapsfilosofisk bidrag til denne vitenskapskrigen, i den strengt realistisk-vitenskapelige tradisjonen.

Sannhet og objektivitet er filosofisk sett vanskelige begreper. Hvordan overkommer vi utfordringene med disse vanskelige begrepene? Det gjør vi ved å ta i bruk vitenskapens egne verktøy i filosofiens tjeneste. For ved bruk av matematiske idéer kan vi lage filosofiske teorier der begreper som sannhet og objektivitet får helt klare og anvendbare betydninger.

Vitenskapens vei

Vi har nå gått igjennom hovedideene i masteroppgaven min om vitenskapelig fremskritt. Endel lesere vil nok tenke at flere av disse ideene ikke er nye. Og det stemmer. Nyvinningene her er måten visse ideer av mer filosofisk art er oversatt til, eller omformulert i, et matematisk språk der tenkningen bak disse ideene kommer til uttrykk på en klarere og mer rigid måte. Muligvis også i en litt endret betydning.

Ett slikt tilfelle er fokuset lagt på den mengden modeller en vitenskapelig teori beskriver. Og det nært relaterte poenget, eller perspektivendringen, fra å tenke på en vitenskapelig teori som en beskrivelse av verden, til å tenke på vitenskapelige teorier som beskrivelser av modeller som utelukker andre mengder modeller. Eller sagt på en annen måte, at en vitenskapelig teori utelukker andre mulige måter verden kunne ha vært på. Og dette på en målbar måte.

Et annet slikt tilfelle er det å bruke objektive verktøy fra informasjonsteori til å måle en mengde informasjon i data. Til å tallfeste den intuitive kjensgjerningen av at vi stadig får ny og mer forskningsdata eller -empiri. Dernest å ha denne empirien i en form, nemlig datamodeller, som gjør at vi kan koble dem til, og sammenligne dem med, teorimodellene.

Begge disse ideene, og koblingen mellom dem, krevde en objektiv, mer matematisk formulering for å kunne artikulere en klar teori om vitenskapelig fremskritt. Det var hovedutfordringen for masteroppgaven.

I en videre kontekst kan masteroppgaven ses som et uttrykk for, og et bidrag til, en tradisjon som kalles naturalistisk filosofi, der man ikke anerkjenner noe prinsipielt skille mellom filosofi og vitenskap. En filosofi uten nære koblinger til vår beste vitenskap, er en filosofi irrelevant for vår virkelighet.