Dataa suoneen

Joonas Rauha - 29.11.2018 10:09:24
Dataa suoneen

Erityisesti datan keräämistä on tapahtunut koko 2000-luvun aikana valtavasti ja tämä tulee vain kasvamaan tulevaisuudessa. Valtavia datamassoja kuitenkin hyödynnetään huomattavasti vähemmän, tai ainakin suppeamman kerhon puolesta. Ihmisten kannattaisi herätä tähän asiaan, sillä se ei tule häviämään mihinkään, vaikka pään tunkisi kuinka syvälle kukkapenkkiin. Ehkä ongelma on siinä, etteivät ihmiset ymmärrä mitä data on ja mihin sitä voitaisiin käyttää, tai eivät ainakaan ymmärrä ymmärtävänsä.

Mitä se data sitten oikein on? Se voi olla miltein mitä tahansa ja sitä on kaikkialla, ihmiset ja asiat tuottavat jatkuvasti dataa, vuoden 2018 aikana on kerätty 50 kertaa enemmän dataa kuin edellisen 5 vuoden. Kaikesta mitä tapahtuu, muodostuu dataa, jos sitä vain joku sattuu keräämään johonkin talteen. Data itsessään tai yksinään ei välttämättä tarkoita mitään ja sen laadussa voi olla suuriakin eroja. Siksi onkin tärkeää kuvata kerättävää dataa ns. metatiedolla, eli dataa kuvaavalla tiedolla.

Meta data

On myös ymmärrettävä, että data on eri asia kuin tieto. Yleensä vaaditaan paljon ja hyvälaatuista dataa, jotta siitä voidaan muodostaa luotettavaa tietoa. Tämä ajatus aukeaa todennäköisesti parhaiten jonkin samaistuttavan esimerkin kautta.

Otetaan vaikka Meteorologia eli ilmatiede, jota käytetään mm. sään ennustamisessa. Meteorologit eivät suinkaan käy aikakoneella tulevaisuudessa tarkistamassa minkälainen keli siellä on, vaan tulkitsevat mennyttä ja tämänhetkistä paikka- ja säädataa ja muuttavat sen virtaus- ja lämpödynamiikan sääntöjen avulla hyödylliseksi tiedoksi tulevaisuudessa todennäköisesti tapahtuvista alueellisista sääilmiöistä. Tämän datasta murskatun tiedon voi ottaa sitten itselleen hyötykäyttöön, vaikka seuraavan viikonlopun suunnittelussa.

Pekka Pouta moshpitissä

Miksi minun pitäisi välittää datasta, jos puhelimeni kertoo minulle viikonlopun sään muutenkin? No ainakin siksi että päätökset yrityksessä (tai elämässä) olisi yleensä hyvä pohjata tietoon, joka taas pohjautuu dataan. Jos ei mitään muuta, niin tämä antaa mukavasti perspektiiviä maailmankatsomukseen.

Yleensä data yhdistetään yliopistoihin ja tieteelliseen tutkimukseen, joka pyrkii selittämään ilmiöitä ja näin luomaan enemmän tai vähemmän hyödyllistä tietoa asioista. Nykyään kuitenkin dataa keräävät, hyödyntävät ja siitä etenkin maksavat, jos jonkin sortin organisaatiot ja instituutiot. Siksi yksi nykyajan kuumoittavimpia trendejä on henkilökohtaisella tiedolla maksaminen, maksat siis todella monien palveluiden käytöstä antamalla henkilö- ja käyttäytymistietosi kapitalististen järjestelmien vapaaseen käyttöön. Tämä ei välttämättä tunnu henkilökohtaisella tasolla kovin pelottavalta asialta, mutta se muuttuu pelottavaksi varsin nopeasti, kun tietoja käytetään politiikassa esimerkiksi äänestäjien manipulointiin.

Datasta voi olla montaa mieltä, onneksi läheskään kaikki data tai sen kerääminen ei onneksi ole pahasta. Itse katselen dataa paksujen fanilasien takaa, joten esimerkiksi datan vapauttamis- trendistä on helppo olla innoissaan. Tällä tarkoitan eri tahojen kuten vaikka valtion tai kuntien pyrkimyksiä avata omat datavarastonsa julkisiksi, koneluettaviksi, maksuttomiksi ja järkevien lisenssiehtojen alaisuuteen.

Tämä avaa aivan uusia ovia kaikille meille datafaneille, jotka elämme toinen jalka tietoyhteiskunnassa ja toinen datayhteiskunnassa. Koska tiede luo tietoa, joka kuvaa maailmaa, joka taas pohjautuu dataan, tarkoittaa kaiken mahdollisen datan vapauttaminen todella siistejä juttuja kaikille elämän osa-alueille.
Miltä kuulostaisi tehdä asunnon vuokraus-/ostopäätös tarkkoihin tietoihin alueen kulkuyhteyksiin, talvikunnossapito-, tai kaavasuunnitelmiin (mahdolliset riskit asunnon arvon romahtamiseen), meluselvityksiin, ilmanlaatuindekseihin jne. perustuen. Tämä oli vain pinta raapaisu datan käytön mahdollisuuksista, pienellä kaivelulla dataseteistä löytyisi vaikka miten paljon muutakin mielenkiintoista ja erityisesti päätöksentekoon vaikuttavaa.

Data on uusi valuutta

Data on uusi öljy, kulta, timantti tai vastaava arvokas materiaali, itse lisään tähän rimpsuun valuutan, se kuvaa mielestäni dataa paremmin koska on huomattavasti uusiutuvampi resurssi. Tämä on varsin hauska ajatusleikki, sillä erityisesti hyvälaatuinen data voi olla todella arvokasta oikeissa käsissä. Jottei kaikki olisi kuitenkaan kuin piikittömillä ruusuilla tanssimista, on meillä datafaneilla vielä paljon hommia edessä. Suurin urakka on varmasti massiivisen laivan kääntäminen, joka tapahtuu aina niin tuskallisen hitaasti. Juurtuneet ajattelumallit kuten “Ei toimi meillä”, “Miksi me nyt sellaista kun näin on pärjätty ennekin” ovat pesiytyneet päättävään kerrokseen kuin välinpitämättömyys omalla ja kavereiden datalla maksajiin.

Onneksi paljon muutosta on alkanut tapahtua 2010-luvulla, esimerkiksi Helsinki ja Tampere ovat avanneet todella kunnioitettavan määrän dataa. Suosittelenkin kaikkia käymään katsomassa niitä täällä. Jos silmään sattuu osumaan jotain mielenkiintoista datapakettia, kannattaa niiden avaamista lähteä rohkeasti ehdottamaan esimerkiksi oman kunnan tietohallintopäällikkölle. Pidetään kuitenkin mielessä, ettei kaikilla ole Helsingin kaltaisia resursseja datan vapauttamiseen, mutta jos ei muuta niin suuret rattaat on hyvä saada pyörimään. Meillä Joensuussakin on vihdoin herätty avoimen datan tuomaan arvoon ja sitä on jo lähdetty viimevuosina vapauttamaan.

Meitä Kooderslaisia ainakin kiinnostaa data ja sen mahdolliset hyödyntämistavat ihmisten ja yritysten arjessa.