Data on valtaa

Timo Harakka:
Datakapitalismi kriisien maailmassa
Siltala 2023. 168 sivua.

Suomi on teknologiamaa; maa, joka on täynnä koodareita ja nörttejä. Siihen nähden on yllättävää, että päättäjistämme häviävän pieni osa on teknologiaosaajia.

Ministeri Timo Harakka on piristävä poikkeus tässä asiassa. On hienoa, että liikenne- ja viestintäministeri ehti arkityönsä ohessa kirjoittaa perusteellisen kirjan datan merkityksestä, ja siitä miten sen käyttöä yritetään säädellä. Iltalehden haastattelussa Harakka avasi: ”idea on se, että virassa oleva ministeri kirjoittaa omasta alastaan analyysin siitä, mitä on kolmessa vuodessa oppinut. Ajattelin, että velvollisuuteni on jakaa sitä ymmärrystä, mikä minulle on koitunut siitä, mitkä datataloudessa ovat Suomenkin kannalta olennaisia ja tärkeitä kysymyksiä.”

Datan kerääminen, järjestäminen, jälleenkäsittely, kauppaaminen, analysointi, jalostaminen ja hyödyntäminen on ihmiskunnan tärkein bisnes. Tästä lähtökohdasta kirja läpikäy huiman listan esimerkkejä siitä, miten data todella pyörittää koko maailmaa, ja miten maailman suurimpien teknologiayritysten liiketoimintalogiikka on täysin erilainen kuin edellisten sukupolvien yrityksillä. Dataa kerätään ja varjellaan mustasukkaisesti. Liiketoimintaa kasvatetaan tappiollisesti, kunnes kilpailijat näivettyvät pois. Rahat tehdään kansojen datalla, mutta verot maksetaan jonnekin muualle, jos ollenkaan. Paikalliset verojärjestelmät eivät pysy kansainvälisen pääoman liikkeiden perässä, eivätkä hahmota ylikansallisen alustakilpailun logiikkaa. Datan keskittyminen on ongelmallista,­ koska se johtaa uusien innovaatioiden ja kilpailun vähenemiseen. Tästä syystä data-alustat ovat olleet lainsäätäjien ja kilpailuviranomaisten hampaissa. Kirja kattaa myös geopolitiikan vaikutukset dataan. EU:n sääntelyä avataan useallakin eri tavalla. Tutuksi tulevat digitaalisia palveluja koskeva säädökset DMA, DSA, DGA, DA ja AIA.

Data on valtaa, jolla tahkotaan rahaa. Usein sanotaan, että data on rahaa, tai data on uusi öljy tai data on uusi uraani. Harakka on asiasta kahta mieltä, ja perustelee molemmat vaihtoehdot: data on uusi öljy, ja samaan aikaan data ei ole uusi öljy. Joka tapauksessa data on aikamme tärkeintä bisnestä: datan keräämistä, järjestämistä, jalostamista ja eteenpäin kauppaamista. Pelkästään EU-alueella datatalouden arvoksi arvioidaan lähes tuhat miljardia euroa vuoteen 2025 mennessä.

Teema, joka toistuu läpi kirjan, on datakapitalismin kolme vaihtoehtoa: amerikkalainen, kiinalainen ja eurooppalainen malli – eli kasino, kasarmi tai kansankoti. Datakasino, jossa voittaja vie koko potin. Datakasarmi, jossa data on kontrollin väline. Datakansankoti, jossa data mahdollistaa yhdenvertaisen kansalaisuuden. Meistä suomalaisista kansankoti tuntuu ilmeisen oikealta vaihtoehdolta. Valinta ei valitettavasti ole yksin meidän käsissämme. ”Eurooppalaisten ajatukset pyörivät liikaa Yhdysvaltojen hegemonian rajoittamisessa. Olisi kestävämpää etsiä eurooppalaisen datatalouden, tieto- ja viestintäteknologian omat vahvuudet”, Harakka kirjoittaa.

Kirja pyrkii avaamaan datakapitalismin olennaista kysymystä: kuka oikein omistaa tiedon? Yritykset ovat keränneet datan verkosta suurelta yleisöltä, eikä data siten oikeastaan kuulu kenellekään, mutta silti yritykset pitävät sen tiukasti itsellään. Suomesta lähtöisin oleva MyData-liike yrittää muuttaa tätä niin, että me kaikki omistaisimme oman datamme, aina ja kaikkialla. ”Mitä kertoo yhteiskunnasta, että isolla datalla halutaan ennen kaikkea hallita ja valvoa, eikä mahdollistaa ja vapauttaa?”

Harakka nostaa esiin myös pääministeri Juha Sipilän esittämän ajatuksen siitä, että voisimme saada tuloja myymällä kerättyä toisiodataa maailmalle: ”Radikaali ajatus – jonka en huomannut herättävän mitään reaktioita – oli aikaansa edellä. Datan markkinapaikkoja ei vielä ollut. Terveysdataa ajateltiin tosiaan käytettävän tutkimukseen, ei kaupalliseksi hyödyksi. Mutta miksei lääketehdas saisi ostaa julkista dataa, jos senkin pyrkimys on parantaa sairauksia?”

Suomen kielellä ’computer’ tai ’datorn’ on tietokone. Siis kone, joka tietää (laskimen tai tallentimen sijaan). Tämä termi on ollut vuosikymmeniä edellä aikaansa, sillä se on vasta nyt muuttumassa todeksi. Kehittyneiden tekoälyjärjestelmien ansiosta olemme voineet opettaa koneoppimisjärjestelmille melkein kaiken sen tiedon, mitä ihmiskunta on kerännyt. Lopputuloksena koneet tietävät yhä enemmän. Hakukoneet kuten Google ovat olleet äärettömän hyödyllisiä tiedonjanoisille, mutta hakukone ainoastaan näyttää, mistä voit löytää vastauksen kysymykseesi. Modernit tekoälyjärjestelmät tietävät vastauksen suoraan. Kaikki tämä merkitsee sitä, että datan arvo ja merkitys vain kasvaa tulevaisuudessa: koneoppiminen vaati dataa.

”Keskiverto suomalainen käyttää mobiilidataa 56 gigatavua kuukaudessa. Ruotsalainen 19 gigatavua”. Tämän kaltaisia faktoja nousee esiin melkein joka aukeamalta. Kirjaa oli miellyttävä lukea; Harakka kirjoittaa niin sujuvasti kuin ammattitoimittajalta voi odottaa. Lisäksi on kiinnostavaa, kun kirjoittaja raottaa ministerielämän kulisseja. Milloin oltiin lounaalla Youtuben, Metan ja Twitterin kanssa, milloin ministerikokouksissa Berliinissä, Brysselissä tai Barcelonassa. Myös kirjan kirjoituksen aikana maailmaa muuttaneet pandemia ja Ukrainan sota kulkevat mukana rivien välissä. ”Rauhan aikana algoritmit ovat ongelmallisia, koska ne eivät osaa suitsia valheellista sisältöä, mutta samalla ohjaavat väkivaltaan ja vainoharhaan. Sodan aikana ne ovat vaarallisia.”

Kirja käsittelee digitalisaation vaikutuksia kattavasti; algoritmien vaikutusvaltaa arjessamme, disinformaation merkitystä sosiaalisessa mediassa ja sitä, minkälaisia muutoksia tekoäly tuo mukanaan. Yksi mielenkiintoinen esimerkki kertoi Rikosseuraamusviraston kokeilusta, jossa suomalaiset vangit opettivat tekoälyä. Erityisen kiinnostavaa tässä oli se, että vangit kokivat työn mielekkääksi. ”Vapautumisen jälkeen on eri juttu sanoa tehneensä vankilassa symbolianalyysia oppiville algoritmeille kuin pussittaneensa ruuveja”. Hyytävä esimerkki puolestaan on Hollannin veroviranomaisten oppiva algoritmi, joka rakensi riskiprofiileja lapsietuuksien väärinkäyttäjistä. Viranomaiset määräsivät algoritmin epäilyksen pohjalta rahojen takaisinperintöjä kymmenille tuhansille pientuloisille ja etnisiin vähemmistöihin kuuluville. Seurauksena oli velkakierteitä, avioeroja ja itsemurhia. Yli tuhat lasta otettiin huostaan. Kun totuus paljastui, Hollannin hallitus joutui eroamaan.

Harakka alleviivaa teoksessaan kuinka nykyinen datatalous ei toimi, sillä digijättien edut ovat etusijalla yksilön ja koko yhteiskunnan etujen kustannuksella. Datakapitalismi kriisien maailmassa on tiivis ja kiinnostava raportti politiikan, talouden ja bittien sekä algoritmien maailmasta.

Kirjoittaja

Mikko Hyppönen on WithSecuren tutkimusjohtaja. Hyppönen on suorittanut 172. maanpuolustuskurssin ja luennoinut maanpuolustuskursseilla vuodesta 2002 lähtien.

Lisää artikkeleita: