Tähtitiede on yksi niistä harvoista tieteellisistä aloista, jotka näyttävät vangitsevan kaikkien kiinnostuksen. On inhimillistä katsella taivaita öisin ihmeissään ja kunnioituksessaan, ja olemme muinaisista ajoista lähtien pyrkineet ymmärtämään maailmankaikkeutta ja paikkaamme siinä. Nicolaus Copernicuksen, Johannes Keplerin ja Galileo Galilein ajoista lähtien modernin tähtitieteen vallankumoukset ovat ravistelleet tieteen ja yhteiskunnan perustaa. 2000-luvulla Sloan Digital Sky Surveysin kaltaiset suuret tähtitieteelliset tutkimukset, NASA:n Keplerin ja Euroopan avaruusjärjestön Gaian kaltaiset avaruuspohjaiset observatorioista sekä monimessengerin ja gravitaatioaaltoastronomian valkeus ovat mahdollistaneet joitakin elämämme merkittävimmistä löydöistä. Tänä big datan aikakausina tähtitiede on löytänyt epätodennäköisen sankarin – tilastoja.
Astrostatistisuus toiminnassa
Gravitaatioaallot ovat aaltoja aika-avaruudessa (jota edustaa vihreä ruudukko), jota tuottavat kiihtyvät kehot, kuten vuorovaikutuksessa olevien supermassiiviset mustat aukot. Nämä aallot vaikuttavat aikaan, joka kestää, ennen kuin sykareista (joita harmaat pallot edustavat) tulevat radiosignaalit saapuvat Maahan. Luotto: David Champion/NASA/JPL. Penn Staten astronomi Eric Ford tutkii planeettajärjestelmien muodostumista ja evoluutiota. Keplerin ja Gaian tehtävistä sekä erilaisista maanpohjaisista kyselyistä peräisin olevien tietojen avulla hän yhdistää kehittyneitä tilastollisia ja laskennallisia algoritmeja monimutkaisissa malleissa, jotka voisivat auttaa tiedottamaan tulevien eksoplaneettojen metsästystutkimuksia, joissa etsitään mahdollisesti asuttavia planeettoja, jotka kiertävät auringonkaltaisia tähtiä.
”Yritämme soveltaa perusfysiikkaa ennustaaksemme, mitä maailmankaikkeudessa tapahtuu”, Ford sanoo, ”Tilastojen avulla voimme mennä laadullisista tarkastuksista kvantifiointiin ’Kuinka hyviä ennusteemme ovat?’ Ovatko ne hyväksyttäviä? Onko tämä malli riittävän tarkka ja tarkka tiedetavoitteidemme saavuttamiseksi?”
Feigelsonkin soveltaa eksoplaneettojen opiskeluun tilastoja, jotka keskittyvät erityisesti Kepler-operaation havaintojen tietoihin. Erittäin herkällä valomittarillaan Kepler pystyi havaitsemaan äärettömän pieninä uppoamisia tähtien kirkkauteen, kun kiertävät planeetat kulkivat noiden tähtien läpi kulkien niiden edessä sen näkölinjaa pitkin. Mutta Keplerin herkkyys toi myös odottamattoman ongelman päivänvaloon: Useimmissa tähdissä on luontaisia kirkkauden vaihteluita, jotka voivat hämärtää planeettojen kauttakulkujen merkkejä. Vastatakseen tähän haasteeseen Feigelson muunsi kaikista asioista mallinnusmenetelmän, jota ekonomistit käyttävät yleisemmin osakemarkkinoiden ennustamiseen.
”Näiden tähtien vaihtelevien variaatioiden poistaminen päätyy tilastollisiksi onniksi”, hän sanoo. ”Tähtitieteilijät olivat kehittämässä menetelmiä niiden poistamiseksi eri tavoin, mutta he kaipasivat tilastotieteilijöiden ja ekonometrien yleisintä lähestymistapaa tällaiseen ongelmaan 1970-luvulta lähtien, eräänlaista regressiota, jota kutsutaan autoregressiiviseksi mallinnukseksi. Mietinkin, toimisiko tämä tähtiin. Jatko-opiskelijani Gabriel Caceres kokeili sitä ja huomasi sen olevan erittäin onnistunut. Periaatteessa uudelleenjärjestämme osan NASA:n putkesta menetelmillä, joita aikasarjatilastotieteilijä pitäisi täysin normaalina, mutta jotka olivat suurelta osin käyttämättömiä tähtitieteessä. Tällä toimenpiteellä päädyimme paljastamaan useita kymmeniä uusia ehdokasplaneettoja, jotka kiertävät Kepler-tähtiä.”
Mitä on edessä
Kaikki tämä tieto on ratkaisevan tärkeää universumimme ymmärtämiseksi paremmin, ja vaikka sen soveltamisala voi rajoittua suurelta osin tähtitieteeseen ja muihin, läheisesti toisiinsa liittyviin alojen aloille, taustalla olevan tutkimuksen vaikutus heijastuu ulospäin koko tieteessä.
”Kysymykset siitä, miten aurinkokuntamme muodostui, miten Maa sopii kuvaan, onko elämä maailmankaikkeudessa yleistä vai harvinaista, ovat sinänsä luonnostaan kiinnostavia”, Ford sanoo. ”Mutta minulle prosessi, jossa opimme niitä asioita, kehitämme tekniikoita ja kouluttamaamme opiskelijoita, ovat yhtä tärkeitä ja mahdollisesti jopa suurempia perintöjä, mitä tulee vaikutukseemme yhteiskuntaan. Tätä tietoa voidaan soveltaa monenlaisiin asioihin tähtitieteen lisäksi.”
Todellisuudessa me kaikki hyödymme paremmasta tilastosta. Kaiken datan avulla sen menetelmät ja ajattelutavat ovat ratkaisevan tärkeitä tieteen edetessä yhteiskuntaa kohti parempaa ja kestävää tulevaisuutta. Sen oivallukset ovat edistää kauaskantoisia aloitteita, jotka koskevat yksilöllistä lääketiedettä ja julkista terveyttä, vihreää energiaa ja maailmanlaajuista taloutta, meteorologiaa ja ilmastonmuutoksen hillitsemistä – luettelo jatkuu. Dataa on kaikkialla. Nopeasti kehittyvän teknologian avulla voimme kerätä niitä yhä nopeammin. Ja nyt suuri haaste on saada suurin merkitys noista tiedoista. Onnistuessaan tilastot voidaan vielä aivan oikein laskea 2000-luvun tieteen sankareiden joukossa.