Sisällysluettelo
Euroopan komission tuore konsultaatio Googlen hakudatan jakamisesta kuulostaa ensi kuulemalta tekniseltä kilpailukysymykseltä. Juridinen viitekehys on Digital Markets Actin 6(11) artikla, ja muodollinen tavoite on tehdä hakumarkkinasta avoimempi pakottamalla Google jakamaan anonymisoitua hakudataa kolmansille osapuolille kohtuullisin ehdoin. Komission omien asiakirjojen mukaan kyse olisi ranking-, kysely-, katselu- ja klikkausdatan jakamisesta muille hakukoneille, mukaan lukien hakutoiminnallisuuksia tarjoavat tekoälychatbotit. Konsultaatio avattiin 16. huhtikuuta 2026, määräaika oli 1. toukokuuta 2026, ja komissio ilmoittaa aikovansa tehdä lopullisen, Alphabetia sitovan päätöksen 27. heinäkuuta 2026.
Kilpailupoliittisesti ajatus on ymmärrettävä. Jos markkinan portinvartija pitää kaiken olennaisen datan itsellään, uusien toimijoiden on lähes mahdotonta kuroa umpeen etumatkaa. Yksityisyyden näkökulmasta asetelma on kuitenkin paljon synkempi. Haku ei ole tavallista käyttödataa. Ihminen kirjoittaa hakukenttään usein asioita, joita hän ei sano ääneen kenellekään: oireitaan, pelkojaan, rahahuoliaan, uskonnollisia kysymyksiään, seksuaalisuuttaan, parisuhdeongelmiaan, oikeudellisia huoliaan ja kaikkea sellaista, mitä hän etsii juuri siksi, että uskoo olevansa edes jossakin määrin yksin.
Siksi hakudatan avaaminen ei ole vain kilpailukysymys. Se on kysymys siitä, saako digitaalisen ihmisen sisäisen puheen muuttaa kauppatavaraksi laajemmalle joukolle toimijoita kuin ennen. Tämä huoli ei ole perusteeton, sillä Yhdysvaltain liittovaltion kauppakomission raportit ovat kuvanneet suuria verkkoalustoja massiivisen kaupallisen valvonnan infrastruktuurin rakentajiksi, joilla on pääsy ihmisten mieltymyksiin, suhteisiin, terveystietoihin ja käyttäytymiseen tavoilla, joita käyttäjät eivät usein odota.
Mitä komissio oikeastaan ehdottaa?
Komission tapausyhteenveto on tässä suhteessa paljon konkreettisempi kuin verkossa kiertävät iskulauseet. Ehdotuksen mukaan Alphabetin olisi jaettava dataa viidessä pääluokassa: kenellä on oikeus saada dataa, mitä dataa on jaettava, miten se anonymisoidaan, millä hinnoittelulla sitä tarjotaan ja millä käytännön prosessilla sitä luovutetaan.
Itse datan osalta komissio lähtee niin sanotusta pariteettiperiaatteesta: muiden hakukoneiden pitäisi saada käyttöönsä olennaisesti samaa hakudataa, jota Google itse käyttää palvelunsa optimointiin. Tämä kattaa vähintään käyttäjän syöttämät haut, hakujen muokkaukset, katseludatan, klikkausdatan ja rankingdatan. Asiakirjoissa mainitaan myös metatietoja, kuten hakuaika, sijainti, kieli ja laiteluokka. Lisäksi dataa olisi tarkoitus jakaa päivittäin, rajapinnan tai vastaavan tehokkaan työkalun kautta, ja vähintään viiden vuoden ajan.
Juuri tässä kohtaa yksityisyyskysymys muuttuu vakavaksi. Kun dataa ei jaeta satunnaisina otoksina vaan päivittäin, vuodesta toiseen, kyse ei enää ole vain markkinan avaamisesta. Kyse on käytännössä jatkuvan, strukturoitavan käyttäytymisdatan virran rakentamisesta. Se ei ole sama asia kuin yhden vuoden tutkimusaineisto tai rajattu kokeilu. Se on pysyvä infrastruktuuri.
“Anonymisointi” ei ole taikatemppu
Komissio ei tietenkään esitä, että Googlen olisi jaettava raakaa henkilötietoa sellaisenaan. Päinvastoin, asiakirjoissa kuvataan teknisiä ja sopimuksellisia anonymisointitoimia, joiden tarkoituksena on vähentää uudelleentunnistamisen riskiä. Ehdotuksissa mainitaan muun muassa tilitunnisteiden ja IP-osoitteiden poistaminen, pitkien hakujen sekä harvinaisia sanoja sisältävien hakujen suppressio, sijainti- ja laitetietojen yleistys sekä sessiodatan rajaaminen tilanteisiin, joissa haut ovat aiempien hakujen tarkennuksia. Lisäksi vastaanottajille asetettaisiin sopimusperusteisia kieltoja: dataa ei saisi käyttää muihin tarkoituksiin, sitä ei saisi säilyttää yli 13 kuukautta, eikä sitä saisi jakaa eteenpäin. Vastaanottajia myös auditoitaisiin ennen pääsyä ja vuosittain sen jälkeen.
Kaikki tämä kuulostaa paperilla huolelliselta. Ongelma on, että anonymisointi ei ole mekaaninen tapahtuma, jossa henkilön voi yksinkertaisesti irrottaa datasta kuin nimilapun takista. Hakukäyttäytyminen on poikkeuksellisen tunnistavaa. Yksittäinen ihminen ei kirjoita vain yhtä geneeristä hakua, vaan sarjan kysymyksiä, tarkennuksia, klikkauksia, kielivalintoja, sijaintisidonnaisia tarpeita ja aikajärjestyksiä, joista voi muodostua hyvin yksilöllinen sormenjälki.
Siksi kuva, jossa “nimi poistetaan ja ongelma ratkeaa”, on vaarallisen yksinkertaistava. Komissiokin myöntää asiakirjoissaan, että anonymisointi edellyttää sekä teknisiä että sopimuksellisia suojauksia juuri siksi, että pelkkä tekninen käsittely ei yksin riitä.
Miksi hakudata on poikkeuksellisen arkaluonteista?
On tärkeää erottaa hakudata monesta muusta alustadatasta. Sosiaalisen median tykkäys kertoo jotakin. Verkkokaupan ostos kertoo jotakin. Mutta hakukysely on usein suoremmin sidoksissa ihmisen sisäiseen tilanteeseen. Hakukenttä on paikka, johon kirjoitetaan, kun tietoa ei vielä ole, kun epäilys on vasta herännyt, kun oire pelottaa, kun avioliitto horjuu, kun velat painavat tai kun ihminen haluaa tietää jotakin itsestään ennen kuin kertoo siitä kenellekään.
Juuri siksi hakudata voi paljastaa terveydentilaa, raskautta, seksuaalista suuntautumista, poliittisia kiinnostuksia, uskonnollista pohdintaa, talousahdinkoa, oikeudellisia ongelmia ja riippuvuuksia. Tätä ei tarvitse liioitella, jotta se olisi totta. Riittää, että ajatellaan tavallista ihmistä tavallisena iltana puhelin kädessään. Hän ei kirjoita hakukenttään omaa julkikuvaansa. Hän kirjoittaa siihen ongelmansa.
Verkossa kiertävä varoitus ei ole täysin väärässä – mutta se kärjistää
Konsultaatiota koskeva kiertävä someväite esittää, että komissio olisi “varastamassa Euroopan hakuhistorian”. Sanavalinta on selvästi kärjistävä. Virallisesti kyse ei ole takavarikosta vaan kilpailusääntelyn nojalla määrättävästä datan jakamisesta, jonka pitäisi tapahtua anonymisoidusti ja valvotusti. Silti kärjistys osuu yhteen olennaiseen hermoon: kyse ei todellakaan ole pienestä tai harmittomasta dataluovutuksesta.
Komission asiakirjojen sanamuoto “all query, view, click and ranking data” on jo itsessään hyvin laaja. Kun siihen lisätään metatiedot, päivittäinen jakotahti ja usean vuoden aikajänne, kyse on poikkeuksellisen mittavasta käyttäytymisdatan luovutusjärjestelmästä.
Toisin sanoen: väite “varkaudesta” on poleeminen, mutta väite massiivisesta, poikkeuksellisen herkästä datansiirrosta ei ole tuulesta temmattu.
Uusi hyötyjäjoukko tarkoittaa myös uutta riskipintaa
Yksityisyyden kannalta ehkä kaikkein aliarvioiduin näkökulma on tämä: jokainen uusi datan saaja on myös uusi vuotoriski. Yksi ainoa suuri alusta on jo itsessään ongelmallinen. Mutta jos hakudataa ryhdytään jakamaan useille hyväksytyille kolmansille hakukoneille ja tekoälytoimijoille, yksityisyysriski ei vain jatku – se moninkertaistuu.
Komission ehdotuksissa vastaanottajille asetetaan auditointeja, sopimusvelvoitteita ja käyttötarkoitusrajoja. Näillä on merkitystä, mutta ne eivät poista rakenteellista tosiasiaa: mitä useampi toimija saa dataa, sitä useampi paikka voi vuotaa, väärinkäyttää tai tulla murretuksi. Turvallisuudessa heikoin lenkki määrää paljon. Jos miljoonien eurooppalaisten hakukäyttäytyminen virtaa useille eri toimijoille, yksityisyyden suoja on lopulta riippuvainen myös pienimpien, heikoimmin suojattujen tai myöhemmin omistajaa vaihtavien toimijoiden kyvystä pitää aineisto kurissa.
Viiden vuoden jatkuva jakaminen on paljon enemmän kuin markkinakorjaus
Komission perustelu nojaa kilpailuun. Se on aidosti relevantti tavoite, sillä Googlen asema haussa on niin ylivoimainen, että ilman jonkinlaista datan avaamista uusien toimijoiden nousu on vaikeaa. Mutta kilpailupoliittinen tavoite ei automaattisesti oikeuta mitä tahansa keinoa. Viiden vuoden vähimmäiskesto, päivittäinen jakaminen ja laaja datasisältö tekevät tästä enemmän kuin markkinakorjauksen. Ne tekevät siitä uuden pysyvän tiedonjakelurakenteen.
Tässä kohtaa olisi kysyttävä paljon nykyistä suoremmin: missä menee raja? Milloin markkinoiden avaaminen muuttuu yksityisyyden purkamiseksi? Onko olemassa kevyempiä vaihtoehtoja, kuten suppeammat tietoluokat, pidemmälle viedyt aggregaatiot, riippumattomat tutkimusympäristöt tai aidosti tiukemmat rajaukset siihen, mitä saa jakaa ja kuinka kauan?
Tämä ei ole vain Google-kysymys
On houkuttelevaa lukea tämä tapaus niin, että pääongelma olisi Google ja ratkaisu kilpailu. Yksityisyyden näkökulmasta asetelma on päinvastoin vaikeampi. Ongelma ei ole vain se, että yksi yhtiö tietää liikaa. Ongelma on myös se, että samaa logiikkaa ollaan nyt levittämässä useammalle toimijalle.
Kun hakudataa aletaan jakaa “hyödyllisesti anonymisoituna” uusille hakukoneille ja tekoälypalveluille, rakennetaan samalla uusi oikeudellinen ja tekninen normaali: ajatus siitä, että ihmisten intiimein tiedonhaku on kilpailu- ja innovaatiojärjestelmän raaka-ainetta. Tämä on paljon suurempi muutos kuin yksittäinen DMA-pykälä antaa ymmärtää.
Yksityisyyden näkökulmasta oikea periaate on yksinkertainen
Ihmisen hakuhistorian pitäisi kuulua lähtökohtaisesti hänelle, ei alustalle, ei kilpailijalle, ei analytiikkamarkkinalle eikä epämääräiselle hyväksyttyjen kolmansien osapuolten joukolle. Jos jokin datalaji ansaitsee erityisen pidättyvän kohtelun, se on juuri hakudata. Sillä voi nähdä ihmisen läpi tavalla, johon harva muu käyttäytymisdata pystyy.
Komission ehdotus yrittää ratkaista yhden aidon ongelman – Googlen portinvartija-aseman – mutta tekee sen tavalla, joka voi synnyttää toisen, perustavamman ongelman: hakuhistorian muuttamisen jaettavaksi infrastruktuuriksi.
Lopuksi
Euroopan komissio ei ehkä ole “varastamassa” ihmisten hakuhistoriaa siinä muodossa kuin räikeimmät väitteet antavat ymmärtää. Mutta se on ehdottamassa järjestelyä, jossa poikkeuksellisen herkkä käyttäytymisdata siirtyisi päivittäin, vuosien ajan, useille uusille toimijoille anonymisoinnin ja sopimuslausekkeiden varassa.
Yksityisyyden kannalta tämä ei ole sivuseikka. Se on hälytysääni.
Jos hakuhistoria normalisoidaan kilpailupolitiikan polttoaineeksi, seuraava askel on aina helpompi kuin ensimmäinen. Ja juuri siksi tästä pitäisi puhua nyt, ennen kuin järjestelmä muuttuu pysyväksi.
Lähdeluettelo
digital-markets-act.ec.europa.eu/dma100209-consultation-proposed-measures-google-search-data-sharing_en
digital-markets-act.ec.europa.eu/document/download/23746ee4-603d-4b66-84a1-9dbb9513e602_en?filename=DMA.100209+-+Case+summary.pdf
digital-markets-act.ec.europa.eu/document/download/b3aed7f6-c45c-4bfa-b032-b8975a48bb06_en?filename=DMA.100209+-+Preliminary+measures.pdf
ftc.gov/news-events/news/press-releases/2024/09/ftc-staff-report-finds-large-social-media-video-streaming-companies-have-engaged-vast-surveillance