Vieraskynä / Toimitus / 14.6.2016

Tieteen taantumus

Vertaisarviointi vuotaa kuin seula. Suurta osaa tuloksista eivät toistokokeet vahvista. Jopa suora huijaus on hälyttävän yleistä. Samaan aikaan tiedettä ylistetään miltei kaikkien kysymystemme ratkaisijana. Luotamme yhä enemmän yhä huonompaan tieteeseen ja tämä on suuri ongelma, väittää vieraskynässä William A. Wilson.

Tieteen ongelma on, että suuri osa siitä ei yksinkertaisesti ole tiedettä. Viime kesänä Open Science Collaboration -projekti ilmoitti yrittäneensä toistaa sata psykologian koetta, jotka oli julkaistu kolmessa alan arvovaltaisimmassa julkaisusarjassa. Tieteellisten väitteiden perustana on ajatus, että kun kokeet toistetaan likimain identtisissä oloissa, myös tulosten tulisi olla suunnilleen samoja. Viime aikoja lukuun ottamatta hyvin harva on kuitenkaan vaivautunut tarkistamaan järjestelmällisesti, onko asia todella näin.

OSC oli toistaiseksi suurin yritys tarkistaa tietyn alan tulokset – ja myös tyrmistyttävin. Monissa tapauksissa käytettiin alkuperäistä tutkimusaineistoa ja joskus uudet kokeet suoritettiin jopa alkuperäistutkijoiden ohjauksessa. Ällistyttävät 65 % niistä tutkimuksista, joiden tuloksia oli alun perin väitetty positiivisiksi, eivät enää toistettaessa olleet tilastollisesti merkitseviä. Muissa vaikutus oli usein huomattavasti väitettyä pienempi.

Löydökset pääsivät uutisiin ja niistä tuli nopeasti lyömäase yhteiskuntatieteitä vastaan. Ongelma ei kuitenkaan koske vain psykologiaa. Lääketeollisuudessa on ääneenlausumaton sääntö, jonka mukaan puolet kaikesta akateemisesta biolääketieteen tutkimuksesta osoittautuu lopulta vääräksi, ja vuonna 2011 ryhmä Bayer-lääketehtaan tutkijoita päätti tutkia säännön todenperäisyyttä. He tarkastelivat 67 tuoretta lääkekehitysprojektia, jotka perustuivat esikliiniseen syöpäbiologian tutkimukseen.

Ryhmä ei kyennyt toistamaan julkaistuja tuloksia yli 75 prosentissa tapauksista. Kyse ei ollut tutkimuksista epämääräisissä syöpätutkimuksen julkaisuissa, vaan menestyneistä artikkeleista sellaisissa lehdissä kuin Science, Nature ja Cell. Bayerin ryhmä oli hukkumassa huonoon tutkimukseen, ja tämä seikka oli heidän mielestään osasyy lääketuotannon arvoitukselliseen hiipumiseen. Kenties niin monet uudet lääkkeet ovat tehottomia siksi, että niiden kehityksen takana ollut perustutkimus ei pidä paikkaansa.

Kun tutkimuksen tulokset eivät toistu, mahdollisia tulkintoja on kaksi. Ensimmäinen on se, että alkuperäisen kokeen ja epäonnistuneen toiston koejärjestelyissä on ollut todellisia eroja, vaikka tutkijat eivät ole tajunneet asiaa. Näitä eroja kutsutaan puhekielessä ”tapettivaikutuksiksi”, sillä vitsin mukaan koetilan tapetin väri vaikutti tuloksiin. Epäonnistuneen toiston kannalta tämä on onnellisin mahdollinen selitys, sillä se tarkoittaa, että kumpikin koe on paljastanut tosiasioita maailmankaikkeudesta. Meillä on nyt tilaisuus oppia, mikä kokeiden välinen hienoinen ero oli, ja sisällyttää se malleihimme.

Toinen tulkinta on se, että alkuperäinen löydös oli virheellinen. Valitettavasti kekseliäs tilastollinen argumentti osoittaa, että tämä jälkimmäinen tulkinta on paljon todennäköisempi. Argumentti perustuu yksinkertaiseen bayesilaiseen tilastotieteeseen ja sen esitti alun perin John Ioannidis, joka on Stanfordin yliopiston lääketieteellisen tiedekunnan professori. Kuvitellaan, että niityllä on satayksi kiveä. Yhdessä niistä on sisällä timantti, joten on onni, että sinulla on 99 prosentin tarkkuudella toimiva timantinetsintälaite. Kun olet tunnin ajan heilutellut laitetta ympäriinsä ja tutkinut kutakin kiveä vuorollaan, valot alkavat välkkyä ja summerit huutaa erään lupaavan näköisen kiven ääressä. Millä todennäköisyydellä tuon kiven sisällä on timantti?

Useimmat sanoisivat, että jos laitteen tarkkuudeksi luvataan 99 prosenttia, laite on juuri tunnistanut timantin 99 prosentin varmuudella. On vain prosentin mahdollisuus, että lukema on väärä positiivinen. Mutta on otettava huomioon, että vain yksi niityn sadastayhdestä kivestä todella on timantti. Kojeellamme on kyllä hyvin suuri todennäköisyys ilmoittaa oikein, että se on timantti. Mutta timantittomia kiviä on paljon enemmän, ja vaikka kojeella onkin vain prosentin mahdollisuus väittää jotain niistä virheellisesti timantiksi, niitä on sentään sata. Jos siis heiluttelisimme tunnistinta jokaisen niityn kiven yläpuolella, se antaisi keskimäärin kaksi hälytystä – yhden oikeasta timantista ja yhden tavallisesta kivestä, joka laukaisi väärän lukeman. Jos tiedetään ainoastaan, että hälytys on saatu, nämä kaksi mahdollisuutta ovat suunnilleen yhtä todennäköisiä. Mahdollisuus todella löytää timantti kiven sisältä on siis noin 50 prosenttia.

Tämä on yksinkertaistettu versio argumentista, jota Ioannidis soveltaa tieteen omaan prosessiin. Niityn kivet ovat kaikkien testattavissa olevien oletusten joukko. Timantti on oletettu syy-yhteys tai vaikutus, joka sattuu olemaan todellinen, ja timantinetsintälaite on tieteellinen menetelmä. Kahdella seikalla on nyt suunnaton vaikutus: kuinka suuri osuus mahdollisista oletuksista pitää paikkansa ja kuinka luotettavasti koejärjestely voi erottaa toden ja epätoden toisistaan? Ioannidis osoittaa, että monilla eri tieteenaloilla ja asetelmilla näiden kahden parametrin arvot eivät ole lainkaan suotuisia.

Ajatellaan esimerkiksi molekyylibiologian tutkimusryhmää, joka selvittää, onko mutaatio yhdessä ihmisen monista tuhansista geeneistä yhteydessä kasvaneeseen Alzheimerin taudin riskiin. Todennäköisyys sille, että satunnaisesti valittu mutaatio satunnaisesti valitussa geenissä vaikuttaisi täsmälleen toivotusti on hyvin alhainen. Siksi positiivinen löydös on todennäköisimmin näennäinen, kuten niityn kivissäkin – ellei koe onnistu uskomattoman hyvin erottelemaan jyviä akanoista. Itse asiassa Ioannidisin havainto on, että monissa tilanteissa aitojen löydösten tekeminen edes 50-prosenttisella varmuudella edellyttää suorastaan käsittämätöntä tarkkuutta. Tämän vuoksi hänen artikkelillaan on katseen vangitseva otsikko ”Miksi suurin osa tutkimusjulkaisujen löydöksistä on virheellisiä” (Why Most Published Research Findings Are False).

MITEN ON tarkkuuden laita? Siltäkään osin uutiset eivät ole hyviä. Ensiksikin monilla tieteenaloilla pidetään käytännössä hyväksyttävänä, jos väärien positiivisten määrä jää yhteen kahdestakymmenestä. Naiivisti ajatellen tilanne kuulostaa lupaavalta: selvästikin vain viisi prosenttia tieteellisistä tutkimuksista julkaisee väärän positiivisen tuloksen. Ajatusvirhe on kuitenkin täsmälleen sama kuin kuviteltaessa, että pelkkä etsintälaitteen älähdys antaa timantin löytymiselle 99-prosenttisen varmuuden. Todellisuudessa käytäntö merkitsee, että hyväksymme viiden prosentin mahdollisuuden sille, että jotain lukemattomista tutkijoiden harkitsemista vääristä oletuksista pidetään virheellisesti totena. Tällaisella päätöksellä on huomattavan haitallinen vaikutus oikeiden tutkimusten suhteelliseen osuuteen.

Usein lupaavaa syy-yhteyttä tutkitaan monessa itsenäisessä ryhmässä, mutta – ristiriitaista kyllä – tämä vain pahentaa tilannetta. Miksi näin käy? Kuvitellaan, että kolme tutkimusryhmää tutkii jotakin ilmiötä. Kun koko aineisto on analysoitu, yksi ryhmä julistaa löytäneensä yhteyden, mutta kaksi muuta ryhmää ei ole havainnut mitään mainitsemisen arvoista. Jos oletetaan kaikkien kokeiden oma tilastollinen todistusvoima suureksi, tuo yksinäinen positiivinen löydös on lähes varmasti näennäinen. Mutta mitä tapahtuu, kun tulee aika julkaista löydökset? Negatiiviseen tulokseen päätyneet ryhmät eivät ehkä edes vaivaudu kirjoittamaan olemattomasta löydöksestään. Tieteellisiä palkintoja, tutkimusapurahoja tai vakituisia virkoja ei viime kädessä jaeta niille, jotka vain raportoivat, ettei kuviteltu yhteys luultavasti ole todellinen.

Vaikka raportit kirjoitettaisiinkin, niitä ei luultavasti hyväksyttäisi julkaisuun. Julkaisusarjat kilpailevat keskenään huomiosta ja vaikuttavuuskertoimesta. Ne raportoivat aina innokkaammin uudesta, jännittävästä löydöksestä – eivät surkeasta epäonnistumisesta löytää syy-yhteys. Itse asiassa kumpaakin näistä ilmiöistä voi mitata. Koska enemmistö tutkituista oletuksista on vääriä, tieteellisten julkaisusarjojen artikkelienemmistön tulisi ilmoittaa, ettei löydöksiä havaittu, mikäli positiivisia ja negatiivisia todisteita raportoitaisiin ja julkaistaisiin oikeassa suhteessa. Mutta laskennan jälkeen tilanne osoittautuu juuri päinvastaiseksi: lähes jokainen julkaistu tieteellinen artikkeli raportoi löytyneestä syy-yhdeydestä. Tämän täytyy johtua massiivisesta asennevääristymästä.

Ioannidisin argumentti olisi tehokas, vaikka jokainen tieteilijä olisi parhaiden aikomusten motivoima enkeli. Kun inhimillinen tekijä otetaan huomioon, kuva muuttuu todella synkeäksi. Tieteilijät ovat jo kauan tiedostaneet kummallisen tosiseikan, josta käytetään kiertoilmausta ”EE-ilmiö”: kun tutkija tarkastelee syy-yhteyttä, jonka olemassaoloon hän sattumoisin itse uskoo, hän havaitsee sen paljon todennäköisemmin. Suuri osa ilmiöstä voidaan luultavasti selittää sillä, että tutkijat antavat tiedostamattaan vihjeitä tai suggestioita koehenkilöilleen tai -eläimilleen, ehkä niinkin hienovaraisesti kuin ruumiinkielellä tai äänensävyllä.

Jopa parhaiden aikomusten ajamat tutkijat ovat jääneet kiinni mittausten hämärtämisestä tai pienistä pyöristys- ja tilastoanalyysivirheistä, jotka sattuvat tekemään tuloksesta suotuisamman. Hyvin usein kaikki on seurausta vilpittömästä tilastollisesta haksahduksesta, joka johtaa haluttuun lopputulokseen ja jota ei siksi tarkisteta yhtä perusteellisesti kuin jos se olisi viitannut päinvastaiseen suuntaan.

Tahallinen petkutus (tätä ei voi sanoa kauniisti) on kuitenkin paljon laajempi ilmiö kuin tiedeyhteisö yleensä haluaa myöntää. Vilpin laaja yleisyys käy ilmi esimerkiksi siitä, että kun kysymys muotoillaan oikealla tavalla, tieteilijät tunnustavat sen itse. Vuonna 2011 suoritettiin kysely kahdelle tuhannelle psykologian tutkijalle, joista yli puolet myönsi suoraan valikoivansa julkaisuun ne kokeet, jotka tuottivat halutun tuloksen. Tämän jälkeen vastaajia pyydettiin nimettömästi arvioimaan, kuinka moni heidän kollegoistaan oli syyllistynyt vilpilliseen toimintaan. Mitä tarkempi arvaus olisi, sitä suurempi summa luvattiin lahjoittaa vastaajien valitsemalle hyväntekeväisyysjärjestölle.

Kun nimettömiä arvailukierroksia oli suoritettu useita ja niitä oli tarkennettu vilppinsä myöntäneiden lukumäärällä sekä muilla epäsuorilla mittauksilla, tutkimuksen laatijat päättelivät, että noin kymmenen prosenttia psykologian tutkijoista on syyllistynyt suoranaiseen aineiston vääristämiseen. Yli puolet on syyllistynyt vähemmän julkeaan mutta silti vilpilliseen toimintaan. He ovat esimerkiksi väittäneet tilastollisesti ei-merkitsevää tulosta merkitseväksi tai valinneet kahdesta aineiston analysointiin soveltuvasta tekniikasta sen, jonka tulokset näyttivät jälkikäteen suotuisammilta.

Monet tilastollisen vääristelyn menetelmät ovat pirullisen vaikeita huomata. Vääristelyn voi myös saada muistuttamaan niin paljon rehellistä arviota, että syyllinen voi uskottavasti kieltää johtaneensa lukijoita tahallaan harhaan. Data-analyysi on melkoista taidetta ja se sallii pikkutarkimmallekin harjoittajalleen laajan toimintavapauden. Kumpaa näistä tilanteeseen soveltuvista tilastollisista testeistä tulisi käyttää? Pitäisikö tietty tutkimusotoksen osajoukko, jolla on yhteinen piirre, poimia erilleen ja käsitellä sitä kokonaisuutena? Mitä sadoista mitatuista satunnaistekijöistä pitäisi kontrolloida ja miten?

Sama vapaus, jonka ansiosta tilastotieteilijä voi valita aidon signaalin kohinan seasta, mahdollistaa sen, että epärehellinen tieteilijä voi tuottaa lähes minkä tahansa haluamansa tuloksen. Olemattoman tilastollisen merkitsevyyden esiinhoukuttelu, niin kutsuttu ”p-hakkerointi”, on sangen helppoa suorittaa mutta vaikea havaita tapauskohtaisesti. Ja koska suunnaton enemmistö tutkimuksista ei vieläkään julkaise raaka-aineistoaan löydösten mukana, mitään voi harvoin analysoida uudestaan tai tarkistaa, mikäli aikaa ja päteviä vapaaehtoisia olisikin.

Edellä kuvatun epärehellisyyden todellista laajuutta on yritetty arvioida luovasti myös vertaamalla eri ”kovuutta” edustavia tieteenaloja toisiinsa. Tutkimuksen laatinut Daniele Fanelli esitti, että mitä kauemmas fysiikasta mennään, sitä enemmän vapautta tieteilijän kokeellisiin menetelmiin luikertelee ja sitä vähemmän mikään rajoittaa hänen tietoisia ja tiedostamattomia ennakkoasenteitaan. Jos kaikki tieteilijät yrittäisivät jatkuvasti vaikuttaa analyysiensa tuloksiin, mutta saisivat ”pehmeissä” tieteissä enemmän tilaisuuksia tehdä niin, voisi yhteiskuntatieteellisistä julkaisuista odottaa löytävänsä enemmän omien oletusten mukaisia todisteita kuin fysikaalisten tieteiden julkaisuista. Lääketiede ja biologia sijoittuisivat näiden kahden välimaastoon.

Juuri tämän tutkimus havaitsikin – astrofysiikkaan verrattuna psykologiaa tai psykiatriaa koskeva tutkimus raportoi viisinkertaisella todennäköisyydellä positiivisesta tuloksesta. Seikka ei välttämättä todista, että kaikki psykologit manipuloivat aineistoaan tietoisesti tai tiedostamattaan. Kyseessä voi olla myös suunnaton julkaisuvääristymä, mutta kumpi tahansa tulos järkyttää.

FYSIIKASTA puheen ollen: kuinka asiat sujuvat tässä kaikkein kovimmassa tieteessä? Näennäisesti paremmin kuin muissa tieteissä, eikä siksi ole yllättävää, että juuri fysiikasta – mieluiten mahdollisimman teoreettisesta – nouseviin esimerkkeihin viitataan niin johdonmukaisesti ja itsepintaisesti aina, kun halutaan julistaa, että tieteen maailmassa on kaikki hyvin. Fysiikan kansantarinat yhdistelevät lainailtua matemaattista loistoa ja vääjäämättömän edistyksen voittokulkua tavalla, jota lehtimiehet eivät näytä voivan vastustaa.

Fysiikan kokeiden ja tähtitieteen havaintojen lopputulokset näyttävät niin asiallisilta ja ne näyttävät kytkeytyvän niin konkreettisesti ja välittömästi kaiken perustana olevaan todellisuuteen. Ehkäpä siksi voisimme varovaisesti kiertää kaikki kysymykset asenteellisesta tai huolimattomasta analyysista ja tulkinnasta? ”E pur si muove”, kerrotaan Galileon huomauttaneen, ja hänen huokauksessaan voi melkein kuulla satojen tiedetoimittajien toiveen. Heidän kannaltaan olisi kovin kätevää, jos luonto haluaisi aina kertoa meille, kenen teoria on lähimpänä oikeaa.

Oikeastaan juuri pako fysiikan turviin päästää kissan pussista. Millä hyvänsä mitattuna – artikkelien määrällä, tutkijoiden lukumäärällä tai kokonaisrahoituksella – Newtonin, Lagrangen, Maxwellin ja Einsteinin edustama, deduktiivinen, malleja laativa fysiikka on vain pikkuruinen osa modernia tiedettä. Itse asiassa se on pikkuruinen osa myös modernia fysiikkaa. Paljon yleisempää on herkkä ja hauras taito haravoida käsittämättömän suurta määrää kohinaa edistyneen ohjelmiston ja matemaattisten työkalujen turvin. Tavoitteena on löytää edes heiveröinen merkki ilmiöstä, jonka oletetaan olevan olemassa, vaikkei sitä ole koskaan aiemmin havaittu – olipa kyseessä sitten astrofyysinen tapahtuma tai atomia pienemmän hiukkasen hajoaminen.

Edellä kuvattu työ on vaikeaa ja kaunista omalla tavallaan, mutta ei lainkaan itsestään selvää samassa mielessä kuin omenan putoaminen tai planeetan elliptinen rata. Siksi satunnainen kontaminaatio, tahallinen petkutus ja tiedostamattomat ennakkoasenteet vaikuttavat tuloksiin herkästi, kuten aiemmin käsiteltyihin lääke- ja yhteiskuntatieteisiinkin. Kaksi viime vuosien rehvakkainta fysiikan tutkimustulosta – kosmisen inflaation ja gravitaatioaaltojen väitetty havaitseminen BICEP₂-kokeessa Antarktiksella sekä valoa nopeampien neutriinojen löytäminen Sveitsin ja Italian rajalla – on sittemmin vedetty takaisin. Melua on pidetty huomattavasti vähemmän kuin alun perin väitteitä julkaistaessa.

Monet tiedejärjestelmän puolustajat myöntävät ongelman, mutta laulavat ylistystä tieteellisen menetelmän itseään korjaavalle luonteelle. Tie on kyllä kivinen, he sanovat, mutta huolimattomuus, huono onni ja jopa vilppi paljastuvat. Tieteen edistys lakaisee ne pois. Tämän takaavat vertaisarviointi, tutkijoiden välinen kilpailu ja se lohdullinen tosiseikka, että on olemassa objektiivinen todellisuus, jonka koe jokaisen teorian on läpäistävä hylkäämisen uhalla.

Näin kuuluu virallinen oppi. Mutta mainittuja väitteitä kohdellaan harvoin oletuksina, joita tulisi testata. Uuden tiedeuskon partisaanit kertovat mieluusti ”Sokal-huijauksesta” – fyysikko Alan Sokal jätti postmoderniin kulttuurintutkimuksen julkaisusarjaan Social Text julkaistavaksi ammattislangia vilisevän artikkelin, joka oli täynnä virheellisiä ja merkityksettömiä lauseita, ja lehti hyväksyi ja julkaisi artikkelin mukisematta.

Todennäköisesti he eivät kuitenkaan mainitse samanlaista koetta, joka suoritettiin arvostetun British Medical Journalin vertaisarvioijille. Tutkijat muokkasivat arvioitavaa artikkelia tahallaan. He sisällyttivät siihen kahdeksan erilaista suuren luokan virhettä koejärjestelyissä, menetelmissä, aineiston analysoinnissa ja tulosten tulkinnassa, eikä ainoakaan 221 osallistuneesta arvioijasta löytänyt kaikkia virheitä. Keskimäärin he löysivät niitä vähemmän kuin kaksi.

Uskomatonta oli, että vaikka osaa koehenkilöistä oli erikseen varoitettu siitä, että he osallistuisivat tutkimukseen ja arvioitavassa artikkelissa saattaisi olla jotain hieman outoa, he tunnistivat virheitä yhtä vähän. Kaiken kaikkiaan vain 30 prosenttia vertaisarvioijista suositteli, että tahallisesti vääristelty artikkeli hylättäisiin.

Ainoa, missä vertaisarviointi onnistuu, näyttää olevan epäsuosittujen ajatusten julkaisemisen estäminen. Tarkastellaanpa (jälleen) yhtä toistotutkimusta, jonka kohteena olivat tällä kertaa syöpätutkijat. Tutkimuksen ennalta-arvattava lopputulos oli, että vain säälittävät 11 prosenttia tarkastelluista esikliinisistä syöpätutkimuksista oli toistettavissa jälkikäteen. Mutta tämän lisäksi tutkijat havaitsivat toisen kammottavan ilmiön: ”huonoja” artikkeleita, joiden tuloksia ei voitu toisintaa, siteerattiin huomattavasti useammin kuin niitä, joiden tulokset olivat toistettavissa! Tutkijoiden sanoin ”muutamat toistokelvottomat esikliiniset artikkelit olivat synnyttäneet kokonaisen tutkimussuunnan ja satoja toissijaisia julkaisuja, joissa alkuperäisen havainnon osa-alueita täsmennettiin, mutta peruslähtökohtaa ei koskaan pyritty vahvistamaan tai kumoamaan.”

Mainitsematta jää se, että kun kokonainen tutkimussuunta on syntynyt – kun urat, rahoitukset, nimitykset ja arvovalta perustuvat täysin väärään koetulokseen, joka johtui petkutuksesta tai pelkästä huonosta onnesta – tämän seikan nostaminen esiin ei todennäköisesti ole kovin suosittua. Vertaisarvionti lakkaa olemasta yksinomaan hyödytöntä ja muuttuu aktiivisesti haitalliseksi. Se saattaa olla tehoton keino pitää analyyttisiä tai menetelmällisiä virheitä sisältävät artikkelit poissa julkaisuista, mutta se voi olla kuolettavan tehokas keino tukahduttaa kritiikki vallitsevaa tutkimusparadigmaa kohtaan. Vaikka kriitikko saisikin työnsä julkaistua, hän ei saa suosiota virkaveljiltään eikä (mikä vielä tärkeämpää) ohjaajiltaan tai tukijoiltaan huomauttamalla, että yhdessä rakennettu talo lepää rotkon yllä.

Vanhemmat tieteilijät eivät osallistu tieteen levittämiseen ainoastaan kouluttamalla ja mentoroimalla nousevaa sukupolvea. Monilla aloilla on tavallista, että nimekäs ja kunnioitettu tutkija toimii ”vanhempana kirjoittajana” välkyn nuoren tähden ensimmäisissä julkaisuissa. Näin hän lainaa oman arvovaltansa ja uskottavuutensa tulokselle ja viestittää vertaisarvioijille, että seisoo sen takana. Luonnontieteissä ja lääketieteessä vanhemmat tutkijat hallitsevat tyypillisesti laboratorioresursseja – eikä sana nykyään tarkoita vain tieteellisiä instrumentteja, vaan myös henkilökuntaa, joka osaa laatia apurahahakemuksia ja tuntee noudatettavat määräykset.

Ilman näitä nuori tieteilijä ei voi toivoa saavuttavansa merkittävää tutkimusta. Vanhemmat tutkijat hallitsevat pääsyä tieteelliseen maineeseen toimimalla suurten julkaisusarjojen toimituskunnissa ja yliopistojen virkoja täyttävissä komiteoissa. Lisäksi alansa ansioituneet harjoittajat ovat jäseninä tai neuvonantajina niissä hallituksen toimielimissä, jotka myöntävät suurimman osan tieteellisestä rahoituksesta.

KAIKEN TÄMÄN valossa on melkoinen riesa, että vanhemmilla tutkijoilla on todennäköisimmin paljon pelissä vallitsevan tutkimusparadigman suhteen, olipa se mikä hyvänsä – ja vaikka se perustuisi vanhaan kokeeseen, jota ei koskaan ole onnistuttu toistamaan. Kvanttifyysikko Max Planck on kuuluisa lohkaisustaan: ”Uusi tieteellinen totuus ei voita siksi, että se vakuuttaa vastustajansa ja pakottaa heidät valistumaan, vaan ennemminkin siksi, että sen vastustajat lopulta kuolevat ja nousee uusi sukupolvi, jolle uusi totuus on tuttu.”

Planck oli kenties liian optimistinen. Tuore National Bureau of Economic Research -viraston julkaisu tarkasteli, mitä tapahtuu niillä tieteen osa-alueilla, joiden johtavat tutkijat kuolevat yllättäen kykyjensä huipulla. Kävi ilmi, että nuoret tutkijat eivät mielellään haasta tieteen supertähtiä (tästä on runsaasti todisteita), mutta odottamaton äkkikuolema ei merkittävästi paranna tilannetta – varsinkin, kun ”tähden tärkeimmät apurit ovat asemassa, jossa he voivat kanavoida sisäpiiriläisille resursseja (kuten toimituksellista suopeutta tai rahoitusta)”.

Jos tieteen edistystä tarkastellaan Popperin ihanteen näkökulmasta, uusia teorioita tarvitaan selittämään uudet todisteet, jotka eivät sovi vanhojen teorioiden tuottamiin ennusteisiin. Toisaalta harhaoppinen tieteenfilosofi Paul Feyerabend väitti, että uudet teoriat ovat säännöllisesti ristiriidassa parhaiden todisteiden kanssa – ainakin aluksi. Usein vanhat havainnot olivatkin epätarkkoja tai epäolennaisia ja juuri uuden teorian keksiminen innosti kokeellisen tieteen harjoittajat metsästämään uusia havainnointitekniikoita, jotta teoriaa voisi testata. Tämän ”epävirallisen” prosessin menestys perustuu kuitenkin siihen, että kun haavoittuvainen nuori teoria joutuu kestämään ensimmäiset epäilyksen myrskyt, ollaan hilpeän piittaamattomia todisteista.

Oletetaanpa, että Feyerabend on oikeassa ja uusi epäsuosittu teoria voi ohittaa tai hylätä kokeelliset havainnot niin kauan, että se saa jalansijaa. Kuinka paljon kauemmin vanha ja natiseva teoria pystyykään riippumaan ilmassa, vaikka sen premissien pohjana olevat tulokset paljastuvat virheellisiksi? Sitä kun pönkittävät satojen nimekkäiden tieteenharjoittajien maine, vaikutusvalta ja poliittinen mahti.

Tieteen pyhimyselämäkerrat ovat täynnä ilolaulua hankkeen itseään korjaavalle ja itsensä parantavalle olemukselle. Mutta jos raa’at tulokset ovat niin usein virheellisiä, suodatusmekanismit niin tehottomia ja itsekorjausmekanismit niin epäilyttäviä ja hitaita, tiede ei ehkä edes lähesty totuutta monotonisesti. Toisin sanoen entiset teoriat, jotka on nyt ”kumottu” todisteiden valossa ja korvattu uusilla lähestymistavoilla, saattavat olla lähempänä totuutta kuin nykyiset ajatuksemme.

Moista taantumista on tapahtunut ennenkin: 1800-luvulla (aivan oikea) teoria C-vitamiinin puutoksesta keripukin aiheuttajana korvautui virheellisellä uskomuksella, että keripukki johtui pilaantuneen ruoan läheisyydestä. Monet muinaiset astronomit uskoivat aurinkokeskiseen aurinkokuntamalliin, kunnes Ptolemaioksen maakeskinen malli syrjäytti sen. Vääjäämätöntä edistystä rummuttava näkemys tieteen historiasta on nykyisin niin hallitseva, että tästä mahdollisuudesta puhutaan vain vaimeasti kuiskaillen, mutta maailmassamme todella voi menettää ja haudata jotain, mikä kerran tiedettiin.

Oletetaan, että itsensä korjaamista tapahtuu ja teorioiden elämänkaari kulkee tiukasti epätarkemmasta tarkempaa kohti. Entä jos uusien, enimmäkseen väärien tulosten hellittämätön tulva vyöryy sitä nopeammin – niin nopeasti, että tieteen luutuneet ja vaarantuneet totuudentunnistusmekanismit eivät pysty toimimaan? Tuloksena voi olla kasvava määrä tosia teorioita, jotka ovat vajonneet perusteettomien teorioiden alati laajenevan tiheikön uumeniin. Tällöin tosien tieteellisten uskomusten suhteellinen osuus kutistuu samalla, kun niiden absoluuttinen määrä jatkuvasti kasvaa. Borgesin Baabelin kirjastossa oli jokainen tosi kirja, jonka kukaan koskaan saattoi kirjoittaa, mutta kirjasto oli hyödytön, koska se sisälsi myös jokaisen virheellisen kirjan ja niin totuus kuin valhekin hukkuivat hölynpölyn valtamereen.

Siitä pääsemmekin outoon hetkeen, jota elämme. Samalla kun alati turpoava tieteellinen byrokratia suoltaa massoittain tutkimustuloksia, joista suurin osa on luultavasti täysin vääriä, ylistetään tieteilijöitä itseään sankareina ja tiedettä pidetään ainoana pätevänä perustana julkiselle päätöksenteolle. On syytä uskoa, että nämä ilmiöt kytkeytyvät toisiinsa. Kun aiemmin askeettinen koulukunta saa äkkiä viipaleen vaikutusvaltaa, se vetää väkisinkin puoleensa opportunisteja ja humpuukimaakareita, olipa kyseessä National Academy of Sciences tai Clunyn luostari.

Edellä esitetty vertaus ei ole niin julkea kuin miltä näyttää. Luostariaatteen tavoin tiedekin on hanke, jonka päämäärä on yli-inhimillinen ja jää ikuisesti saavuttamatta vajavaisilta ihmisiltä, jotka kyvyillään pyrkivät sitä kohti. Parhaat tutkijat tietävät, että heidän on harjoitettava eräänlaista oman egon kuolettamista ja kehitettävä malttia, jonka ansiosta löydökset voi raportoida silloinkin, kun ne saattavat merkitä toiveiden murskaantumista, rahoituksen kuivumista ja ammatillisen maineen menetystä. Kenenkään ei tulisi hämmästyä siitä, että vaikka tiede kasvoi ulos luostareista, sen harjoittaminen on myöhemminkin vetänyt puoleensa sieluja, jotka etsivät totuutta piittaamatta henkilökohtaisista kustannuksista ja (enimmän historian ajan) huolimatta siitä, että ilmeisiä palkkioita talouden tai maineen alalla ei ollut luvassa.

Aiemmasta poiketen tiede ja varsinkin tieteen byrokratia on nyt ura, joka edesauttaa sosiaalista nousua. Urat houkuttelevat urakeskeisiä henkilöitä, jotka Feyerabendin sanoin ovat ”vailla ideoita, täynnä pelkoa ja vakaasti päättäneet tuottaa jonkin vähäpätöisen tuloksen lisätäkseen kortensa merkityksettömään paperikekoon, josta ’tieteen edistys’ monilla aloilla nykyään koostuu”.

Jos tiede ei ollut valmistautunut urakeskeiseen väenpaljouteen, se oli vielä huonommin valmistautunut Tieteen Kultin kukoistukseen. Kultti liittyy ilmiöön, jota kutsutaan ”tiedeuskoksi”. Näillä molemmilla on taipumus kohdella tieteellistä tietomäärää pyhänä kirjana tai uskonnottomana ilmoituksena, joka tarjoaa yksinkertaisia ja lopullisia ratkaisuja syviin kysymyksiin.

Mutta Kultti lisää tähän hyppysellisen lipevää kevytmielisyyttä ja ripauksen häpeilemätöntä tietämättömyyttä. Sen retorisiin pakko-oireisiin kuuluu väkinäinen intomielisyys (Twitter-haku hashtagilla ”#sciencedancing” kertoo paljon) ja mieltymys rumaan kielenkäyttöön. Täällä Piilaaksossa näkee lähes päivittäin t-paidan, jossa lukee: ”Science: It works, bitc**s!” Suositun uuden elokuvan Yksin Marsissa sankari kerskailee, että hän ”tieteilee p**kat pihalle” tukalasta tilanteesta. Yksi Facebookin suurimmista ryhmistä on nimeltään ”I f***ing love Science!” Ryhmällä on taipumus postata tuskin lainkaan varsinaista tieteellistä materiaalia, mutta paljon kuvia luonnonilmiöistä. Taipumus ja nimi yhdessä ovat saaneet useamman kuin yhden tuntemani aidon tieteilijän mutisemaan puoliääneen: ”Kuvia te oikeasti rakastatte.”

Muutamat Kultin johtajista pukeutuvat mielellään tieteilijöiksi – kaksi erityisen huomattavaa esimerkkiä ovat Bill Nye ja Neil deGrasse Tyson – mutta tuskin kukaan heistä on tuottanut mitään huomionarvoisia tutkimustuloksia. Niiden sijaan Kultin johtajisto on voimakkaasti kallellaan kouluttajien, kansantajuistajien ja journalistien suuntaan.

Parhaimmillaan tiede on inhimillinen hanke, jolla on yli-inhimillinen päämäärä: havaita luonnon järjestyksessä säännönmukaisuuksia ja huomata näiden säännönmukaisuuksien seuraukset. Olemme nähneet esimerkin toisensa jälkeen siitä, kuinka hankkeen inhimillinen osatekijä vahingoittaa ja vaurioittaa sen edistystä epäpätevyyden, petkutuksen, itsekkyyden tai ennakkoluulojen kautta. Joskus syy on yksinkertainen yhdistelmä rehellistä erehdystä tai lipsahdusta ja silkkaa huonoa onnea. Nämä vajavuudet eivät välttämättä rampauta koko tiedehanketta laajasti ymmärrettynä. Riski on kuitenkin vältettävissä vain, jos tieteilijät ovat erittäin tietoisia ja jatkuvasti valppaana virkaveljiensä virheiden varalta… ja omiensa.

Kun kulttuurin virtaukset yrittävät esittää tieteen jonkinlaisena uskonnottomana pappisvaltana, tieteilijät tuppaavat unohtamaan, että heidät on veistetty samasta kierosyisestä puusta kuin muukin ihmiskunta ja he vaarantavat väkisinkin tekemänsä työn. Suurimmat Tieteen Kultin ystävät ovat varsinaisen tieteen harjoittamisen pahimmat viholliset.

Kirjoittaja William A. Wilson on amerikkalainen ohjelmistoinsinööri ja työskentelee San Franciscon lahden ympäristössä. Teksti on ilmestynyt alunperin First Things -lehdessä toukokuussa 2016 otsikolla “Scientific Regress”. Suomennos: Jasu Markkanen.

Kuva: Jan Bommes@Flickr.com. CC BY 2.0.