Kuidas mõista andmestunud maailmaTekst

Loe katkendit
Märgi loetuks
Kuidas lugeda raamatut pärast ostmist
  • Lugemine ainult LitRes “Loe!”
Šrift:Väiksem АаSuurem Aa

GIGANTUM HUMERIS

sarja kolleegium

Airi-Alina Allaste (Tallinna Ülikool)

Karsten Brüggemann (Tallinna Ülikool)

Tiina Elvisto (Tallinna Ülikool)

Indrek Ibrus (Tallinna Ülikool)

Marju Kõivupuu (Tallinna Ülikool)

Mihhail Lotman (Tallinna Ülikool, Tartu Ülikool)

Rain Mikser (Tallinna Ülikool)

Katrin Niglas (Tallinna Ülikool)

Hannes Palang (Tallinna Ülikool)

Ülar Ploom (Tallinna Ülikool)

Kristjan Port (Tallinna Ülikool)

Jaan Puhvel (California Los Angelese Ülikool)

Tõnis Põder (Tallinna Ülikool)

Rein Raud (Tallinna Ülikool)

Raivo Stern (Keemilise ja Bioloogilise Füüsika Instituut)

Marek Tamm (Tallinna Ülikool)

Peeter Torop (Tartu Ülikool)

Jaan Valsiner (Aalborgi Ülikool)

Anna Verschik (Tallinna Ülikool)

Airi Värnik (Tallinna Ülikool)

Gigantum Humeris

Kuidas mõista andmestunud maailma?

Metodoloogiline teejuht

Koostanud ja toimetanud Anu Masso, Katrin Tiidenberg ja Andra Siibak


Õpik kõrgkoolidele

Väljaandmist toetasid programmi „Eestikeelsete kõrgkooliõpikute loomise toetamise põhimõtted 2018–2027“ raames:



Terminitööd rahastas Haridus- ja Teadusministeerium riiklikust programmist „Eesti oskuskeelekorralduse ja terminitöö toetamise põhimõtted (2019–2027)“, mida koordineerib Eesti Keele Instituut


Keeletoimetaja Sirje Ratso

Korrektor Kai Nurmik

Aineloendi koostaja Leino Pahtma

Toimetajate assistent Liina Deutschler

Illustratsioonide autor Ave Taavet

Kaanepildi autor Janne Lias

Küljendaja Sirje Ratso

Sarja makett: Rakett


Autoriõigus: peatükkide, vahetekstide ja illustratsioonide autorid, 2020

Autoriõigus (koostamine): Anu Masso, Katrin Tiidenberg ja Andra Siibak, 2020

Autoriõigus: Tallinna Ülikooli Kirjastus, 2020


ISSN 2228-1029

ISBN 978-9985-58-889-5


TLÜ Kirjastus

Narva mnt 25

10120 Tallinn

www.tlupress.com


E-raamat OÜ Flagella

EESSÕNA

Mõte koostada raamat andmestunud maailma uurimisest ja mõistmisest sai alguse sihtasutuse Archimedes kõrgkooliõpikute kirjutamise kutsungist. Selle raamatu kolmel koostajal tekkis teineteisest sõltumatult mõte panna kokku raamat, mis tutvustaks uusimaid suundi ühiskonna- ja humanitaarteaduslikes, kuid ka teiste seotud distsipliinide uuringutes, ja seda ajal, mil digitehnoloogiad ja internet aina enam uurimishuvi suunavad ja uurimisobjekte vormivad. Jõudude ühendamisel sündis unikaalne meeskond, kelle koostöö tulemusena on nüüd võimalik tutvustada laiemale lugejaskonnale Eestis kasutatavaid originaalseid andmeid, meetodeid ja vaatenurki.

Raamatu kirjutamisel on olnud kolm eesmärki: esiteks, avada andmestunud maailma analüüsimise mitmekesiseid võimalusi ja põhimõtteid; teiseks, tutvustada uudseid Eesti uurimusi ja siin arendatud analüüsimeetodeid; kolmandaks, tekitada huvi uute meetodite kasutamise, katsetamise ja edasiarendamise vastu. Kõik need on eelduseks, et ühiskondlikke muutusi tõendus- ja teadmuspõhiselt juhitaks. Raamatu ambitsioon on käsitleda andmestumisega seotud metodoloogilisi muutusi ning alustada peamiste andmestunud maailma uurimise ja mõistmisega kaasnevate nihete ja suundade kaardistamisega Eestis.

Raamatu kirjutamise käigus selgitasime välja Eestis praegu käibivad andmestunud maailma uurimisega seotud arusaamad ning pakume välja asjakohase eestikeelse terminoloogia. Tutvustame rohket rahvusvahelist tähelepanu pälvinud käsitlusi, ent toome lugejani ka innovaatilisi vaatenurki – mitmed kogumikus kajastamist leidvad meetodid on uuenduslikud ning oma valdkonnas teedrajavad nii Eestis kui ka maailmas. Raamat kajastab Eesti unikaalseid algatusi andmevaldkonnas ning arvestab Eesti kohalike õiguslike ja sotsiaalsete traditsioonide ja normidega. Raamatust leiab nii sammsammulisi juhendeid eri meetodite kasutamiseks kui ka diskussioone andmete õiglase ja eetilise loomise ja kasutamise kohta.

Sellisena on raamat mitte klassikaline õpik, vaid tekstikogumik, mis avab andmeühiskonnas toimuvat ja selle uurimise telgitaguseid oma mitmekesisuses. Kogumikus on teadlikult välditud varasemaid metodoloogilisi jaotusi ja klassifikatsioone (nt kvalitatiivne vs. kvantitatiivne, arvutuslik vs. interpretatiivne, deduktiivne vs. induktiivne). Rahvusvahelised metodoloogilistele uuendustele suunatud diskussioonid on valdavalt päri, et konventsionaalsed klassifikatsioonid piiravad ja risustavad andmestuva maailma mõistmist, millele on omane pigem olemasolevate vahendite segunemine ja brikolaaž. Ehkki käesolev kogumik toetub osaliselt rahvusvahelises kirjanduses pakutud diskussioonidele, oli meie eesmärk pakkuda just Eesti konteksti sobituvat vaadet. Kogumikus pakutud jaotustega – ühiskonna andmestumine, suurandmete mõtestamine, teksti- ja tajuandmete analüüs, andmetega ja andmetest lugude jutustamine, platvormid ja andmetaristud ning andmeühiskonnas tegutsev inimene – soovime panna lugejaid mõtlema valikute ja võimaluste üle, mis seoses andmemaailmas toimuvate muutustega avanevad.

Andmestunud maailma üheks eripäraks on, et meie kõigi igapäevane elu on andmetest läbi põimunud. Sageli oleme enesele teadmata osa ühiskonna andmestumisprotsessist, seetõttu on raamat mõeldud laiale lugejaskonnale. Mahukast kogumikust leiavad kasulikku lugemist nii andmetega igapäevaselt töötavad või seda teha soovivad analüütikud, eksperdid ja otsustajad, andmetega tööd alustavad bakalaureuse- või magistritaseme üliõpilased kui ka juba kogenud eksperdid, kes soovivad oma analüütilist repertuaari laiendada või end andmestunud maailmas toimuvate muutustega paremini kurssi viia. Loodame, et kogumik pakub mõtlemisainet ka kõigile neile, kes ise otseselt andmete analüüsimisega kokku ei puutu, kuid kes loovad oma igapäevases elus ja rutiinsete tegevuste käigus analüüsiks kasutatavaid andmeid ja tahaksid andmestumisega kaasnevaid protsesse paremini mõista, samuti neile, kes sooviksid kodanikuaktiivsuse vormis ja avatud andmete abil panustada avalike väärtuste loomisesse. Kogumiku lai sihtrühm ja temaatiline jaotus peegeldab jällegi andmestunud maailma mitmekesisust, ilmestades koostöövajadust eri valdkondades tegutsevate ekspertide ja aktiivsete kodanike vahel.

Andmestuvat maailma uurivad raamatus eri distsipliinide esindajad: peatükkide autoriteks on 38 meedia- ja kommunikatsiooni, sotsioloogia, avaliku halduse, geoinformaatika, inimgeograafia, keeleteaduse, keeletehnoloogia, digilingvistika, folklooriuuringute, arvutiteaduste, matemaatika, kultuuriajaloo, majandusteaduste, psühholoogia ja õigusteaduste eksperti, õppejõudu ja praktikut kolmest Eesti ülikoolist – Tartu Ülikoolist, Tallinna Ülikoolist ja Tallinna Tehnikaülikoolist – ning mitmest teadus- ja arendusasutustest (nt Eesti Kirjandusmuuseum), eraettevõtetest ja välisülikoolidest (Malmö Ülikool, Helsingi Ülikool).

Selline multidistsiplinaarsus väljendub muu hulgas paralleelselt kasutusel olevates, aga oluliste tähenduslike nüansierinevustega terminite kasutamises. Ehkki terminoloogia ühtlustamine oli oluline osa kogumiku toimetajate ja autorite tööst, ei surunud me peale täielikku ühtlustamist, vaid proovisime erinevad käibel olevad mõtteviisid üksteisele lähemale tuua ning lugejale arusaadavamaks muuta. Teisiõnu – eelistasime lausühtlusele täpsust. Nii on näiteks ingliskeelse termini dashboard jaoks eesti keeles kasutusel kaks täpsemat terminit: andmetöötajatele ja analüütikutele mõeldud n-ö backend-lahenduse puhul „kiiranalüütika paneel“ (ptk 1.1) ja sotsiaalmeediaplatvormide kasutajatele mõeldud n-ö frontend-lahendus, milleks on „kasutaja koondpaneel“ (ptk 4.3). Seesuguseid keelelisi ja distsiplinaarseid tõlkimise ja tõlgendamise valikuid on kogumikus veelgi.

Kuidas seda raamatut lugeda? Raamat on loetav kaanest kaaneni, kuid ka üksikute peatükkide kaupa. Lisaks võib raamatu lõpus olevat märksõnastikku kasutada suunaandjana, et lugeda raamatut lõikude või alateemade kaupa. Lugemisel tekkivatele terminoloogilistele küsimustele leiab vastused raamatu lõpus olevast leksikonist. Iga peatüki alguses on esitatud kolm kõige olulisemat kirjandusviidet käsitletava teema või meetodi kohta. Peatükkides kasutatud tekstikastid annavad praktilist infot ühe või teise meetodi kasutamisest või tarkvaralahendustest, samuti meetodi sammhaaval sooritamise kohta. Raamatu osade vahele lisatud „eksperdisäutsud“ (Twitteri säutsu mõõtmes kommentaarid) loovad konteksti ning ärgitavad mõtlema eri vaatenurkade ja põhimõtete, meetodite ja tehnikate päritolu, ajaloo ja rolli üle laiemas ühiskonnauurimuslikus ökosüsteemis.

Kuna andmed, ühiskond ja andmestunud ühiskond on pidevas muutumises, siis soovime raamatu koostajatena teatepulga lugejatele edasi anda – julgustame lugejaid uute meetoditega katsetama, neid testima ja edasi arendama ning pakkuma aina uusi metoodilisi viise andmeühiskonna mõistmiseks ja mõtestamiseks.

Tänusõnad

Raamatu koostajad tänavad kõiki raamatu kirjutamises pühendumisega osalenud autoreid (tähestikulises järjekorras): Anto Aasa, Mare Ainsaar, Mai Beilmann, Marju Himma, Indrek Ibrus, Olle Järv, Aleksei Kelli, Toomas Kirt, Mare Koit, Ragne Kõuts, Irene Kull, Andres Kuusik, Liisi Laineste, Liina Lindström, Innar Liiv, Anu Masso, Jaan Masso, Kadri Muischnek, Maria Murumaa-Mengel, Kerli Müürisepp, Haldur Õim, Maarja Ojamaa, Hembo Pagi, Kristian Pentus, Maili Pilt, Pille Pruulmann-Vengerfeldt, Ave Roots, Leno Saarniit, Andra Siibak, Siiri Silm, Indrek Soidla, Marek Tamm, Kuldar Taveter, Katrin Tiidenberg, Kristel Uiboaed, Age Värv, Anna Veremchuk ja Triin Vihalemm.

 

Samuti täname raamatu osade vahele siduvad kommentaarid kirjutanud oma ala eksperte Airi-Alina Allastet, Veronika Kalmust, Dagmar Kutsarit, Ene-Margit Tiitu, Liina-Mai Toodingut, Leo Võhandut ja Mikko Lagerspetzi. Raamatu illustreerimise eest oleme tänulikud osade vahetiitlitele karikatuurid joonistanud Ave Taavetile ja kaanepildi teinud Janne Liasele.

Raamat on saanud võimalikuks tänu sihtasutuse Archimedes, Eesti Keele Instituudi, Tartu Ülikooli digihumanitaaria ja infoühiskonna keskuse, Tallinna Ülikooli kirjastuse, Tallinna Tehnikaülikooli arenguprogrammi Astra ning teiste grantide toetusele. Suur aitäh selle eest!

Konstruktiivsete tähelepanekute ja soovituste eest täname raamatuprojekti anonüümseid retsensente. Meie eriline tänu kuulub lõpliku käsikirja retsensentidele Mikko Lagerspetzile ja Kadri Rootalule, kelle ülimalt detailsed ja sisukad retsensioonid on olnud suureks abiks raamatu viimistlemisel. Täname keeletoimetajat ja kujundajat Sirje Ratsot ning Tallinna Ülikooli kirjastust eesotsas peatoimetaja Rebekka Lotmaniga suurepärase koostöö eest raamatu väljaandmisel.

Meie eriline tänu kuulub Liina Deutschlerile, kes lisaks suuremahulisele tööle terminoloogia ühtlustamisel aitas kaasa raamatu leksikoni ja indeksi koostamisele, peatükkide tehnilisele ühtlustamisele ja seeläbi raamatu selgusele ja loetavusele.

Anu Masso, Katrin Tiidenberg, Andra Siibak

SISSEJUHATUS1

Anu Masso, Katrin Tiidenberg, Andra Siibak


LUGEMISSOOVITUSED

• Rob Kitchin, The Data Revolution: Big data, Open Data, Data Infrastructures and Their Consequences. Thousand Oaks CA, Sage 2014.

• Richard Rogers, Doing Digital Methods. Los Angeles, London: Sage 2019.

• Mirko Tobias Schäfer, Karin van Es (eds.), The Datafied Society: Studying Culture through Data. Amsterdam University Press 2017.

Käesolev raamat keskendub andmestumise (datafication)2 kui ühe viimaste aastate olulisima, samas vastuolulise nähtuse uurimisele. Kui täpsem olla, on raamat pühendatud andmestumise uurimise ja mõistmise viisidele – tegemist on kogumikuga, mille keskmes on meetodid ja metodoloogilised võtted.

Andmestumine tähendab lihtsustatult seda, et igapäevased, tavapäraselt valdavalt kaduvad, haihtuvad ja „nähtamatud“ tegevused ning ühiskondlikud protsessid teisendatakse enamasti arvulisteks, vähemalt osaliselt süstematiseeritud (nt andmebaasi koondatud), kvantitatiivseteks ja analüüsivalmis formaadis olevateks andmeteks, mille põhjal ühiskonnas olulisi otsuseid tehakse. Bussisõit, kinopiletite ost ja uudiste lugemine olid mõnikümmend aastat tagasi praktilised, sotsiaalsed ja kommunikatiivsed tegevused, kuid praegusel ajal on need suuresti tänu infotehnoloogia levikule, internetiühenduse valdavusele ja arvutusliku võimekuse kasvule lisaks ka andmeid loovad tegevused.

Andmestumine on hoomatav pea kõigis elu- ja tegevusvaldkondades. Helistamine lähedastele, sammuloendamise rakenduse kasutamine, sotsiaalmeedias suhtlemine, ostutehingud pangakaardiga ja internetikauplusest – need on vaid mõned näited tegevustest, millest jäävad maha andmed. Sellised andmed võimaldavad mõista ühiskonnas toimuvaid protsesse, kuid andmetega läbi põimunud igapäevaelu muutub ka uueks mõistmist ja selgitamist vajavaks nähtuseks.

Järgnevalt anname ülevaate peamistest nihetest, meetoditest, mõtteviisidest ja muutustest seoses maailma andmestumisega. Tuginedes varasematele diskussioonidele ning siinses kogumikus käsitletud meetoditele pakume välja omapoolse lähenemise andmestunud maailma uurimisele.

Kuidas mõista andmestunud maailma?

Esmased sotsiaalteaduslikud diskussioonid andmepöörde teemal (Kitchin 2014a) olid üsna skeptilised selles osas, kuivõrd olemasolevad traditsioonilised sotsiaalteaduslikud põhimõtted uute, suurandmeteks nimetatud andmete konteksti sobituvad. Ühelt poolt ennustati radikaalseid epistemoloogilisi ja paradigmaatilisi nihkeid senises sotsiaalteaduslikus mõtlemises, teisalt otsiti n-ö kolmandat teed traditsiooniliste statistiliste ja uuemate arvutuslike meetodite vahel. Samal ajal kerkisid esile andmeuuringud, mis kutsusid üles kriitiliselt mõtestama andmete ühiskondlikke ja kultuurilisi tagajärgi ning andmete loomise, kogumise ja kasutamisega loodud reaalsust (Dalton et al. 2016).

TEKSTIKAST 1. ANDMETE JA MEETODITE TEEMAL ILMUNUD EESTIKEELNE KIRJANDUS

Mai Beilmann, Ave Roots, Kadri Rootalu (toim.), Sotsiaalse analüüsi meetodite ja metodoloogia õpibaas. 2020. http://samm.ut.ee.

Meri-Liis Laherand, Kvalitatiivne uurimisviis. Tartu: Sulesepp 2010.

Mikko Lagerspetz, Ühiskonna uurimise meetodid: Sissejuhatus ja väljajuhatus. Tallinna Ülikooli Kirjastus 2017. https://www.tlu.ee/pood/home/239-uhiskonna-uurimise-meetodid-sissejuhatus-ja-valjajuhatus.html.

Katrin Niglas, Statistiline andmeanalüüs paketi SPSS for Windows 14.0. Tallinna Ülikooli Kirjastus 2008. http://www.cs.tlu.ee/~katrin/wp/wp-content/uploads/2013/11/SPSS14_pealkirjaga.pdf.

Kadri Rootalu, Veronika Kalmus, Anu Masso, Triin Vihalemm (toim.), Sotsiaalse analüüsi meetodite ja metodoloogia õpibaas. 2014. http://samm.ut.ee.

Ene-Margit Tiit, Liina-Mai Tooding, Statistikaleksikon. Tartu Ülikooli Kirjastus 2019.

Liina-Mai Tooding, Andmete analüüs ja tõlgendamine sotsiaalteadustes. 2., täiend. vlj. Tartu Ülikooli Kirjastus 2015.

Siinse sissejuhatuse eesmärk pole korrata varasemaid sotsiaalteadusliku metodoloogia diskussioone: tekstikast 1 pakub põgusa ülevaate suurepärastest eestikeelsetest teostest, mis keskenduvad just sellele. Käsitleme varasemaid seisukohti ja pikaajalisi dispuute peamiselt muutuste võtmes (vt alajaotus „Metodoloogilised nihked“), mis on vorminud andmestunud maailma uurimist puudutavate diskussioonide pinnase.

Omalt poolt pakume välja uudse lähenemisviisi andmestunud maailma uurimiseks, esitades selleks kümme postulaati (vt tekstikast 2), millest soovitame andmestunud maailma tõlgendamisel ja mõistmisel lähtuda. Postulaatide loomisel tuginesime nii rahvusvahelistele teadusdiskussioonidele, raamatu peatükkides esitletule kui ka meie enda uurimistööst tõusetunud teadmistele.

TEKSTIKAST 2. ANDMESTUNUD MAAILMA UURIMISE POSTULAADID

1. Andmestumine on keeruline protsess, andmesuhted on hierarhilised. Andmete loomine, kogumine ja kasutamine on vastastikku sõltuv, keeruline ja läbipõimunud sotsiaalne protsess. Andmetöös on oluline mõista andmete sageli vastuolulistest ja hierarhilistest suhetest läbipõimitud eluteed.

2. Andmestunud maailmas valitsevad võrgustunud seosed. Andmeühiskonna mõistmiseks ei piisa tavapärastest lineaarsetest põhjuslikest tõlgendustest. Andmeühiskonna mõistmiseks on vaja keskenduda võrgustike seostele.

3. Andmetaristu on avalik hüve. Andmete mitmekesisus ja võrdne juurdepääs andmetele on ülioluline. Selle eest peaks võitlema nii andmesubjektid, andmekodanikud, andmeaktivistid, andmetöötajad kui ka andmeühiskonna uurijad.

4. Eetika ja andmeõiglus peaks olema andmestunud ühiskonna alustalad. Andmete kogumine, analüüsimine ja tõlgendamine, aga ka selle tegemata jätmine peab olema andmesubjekti ning ühiskonna seisukohalt eetiline, õiglane ja õigustatud.

5. Kontekst on kuningas. Andmed vajavad alati tõlgendamist. Tõlgendused peavad lähtuma sotsiaal-kultuurilisest kontekstist. Analüüsitulemused on enamasti üldistatavad vaid konkreetses ajas ja ruumis toimuvatele nähtustele.

6. Andmed ei teki iseenesest. Andmetöötajal ja uurijal on aktiivne roll andmekogumise planeerimisel ja andmete kogumisega seotud valikute tegemisel. Kõiki andmeid, mida on võimalik luua või koguda, ei ole tingimata vaja luua või koguda. Andmeid tuleks luua ja tõlgendada lähtuvalt praktilisest vajadusest ning andmeõigluse ja -eetika põhimõtetest.

7. Teooria pole surnud. Andmestunud maailma uurimine algab asjakohase ja haritud küsimuse püstitamisest. Andmete tõlgendamine peab olema dialoogis huvitava nähtuse kohta juba teadaoleva infoga.

8. Käes on metodoloogilise pluralismi aeg. Mõistlik on meetodeid paindlikult ja uurimisküsimusele vastavalt kombineerida.

9. Paradigmasõjad jäägu minevikku. Andmeühiskonna mõistmisel tuleks lähtuda kasulikkuse põhimõttest, ühelgi distsipliinil ei ole andmeühiskonna mõtestamise monopoli. Traditsioonidest ja distsiplinaarsetest erisustest olulisem on uurimisprobleemi pragmaatiline käsitlus.

10. Andmetöötaja või uurija on kõige olulisem epistemoloogiline tööriist. Andmetöötaja või uurija peaks olema iseteadlik ja teovõimeline ning hindama alati kriitiliselt oma tegevuse tagajärgi.

Kui mõni sõnastatud soovitustest on sotsiaal- ja humanitaarteaduslikus uurimistöös ja ka andmestunud ühiskonna uurimisel juba juurdumas (nt andme-eetika), siis mõne põhimõtte konkreetsed rakendusviisid ja lahendused on alles välja kujunemas (nt juurdepääs andmetaristule, andmeõiglus). Nii pakume neile kümnele postulaadile toetudes välja kuus andmestunud maailma mõistmise viisi, mille järgi oleme peatükid koondanud raamatu osadeks: 1) maailma andmestumine, 2) suurandmete mõtestamine, 3) teksti- ja tajuandmete analüüs, 4) andmetega ja andmetest lugude jutustamine, 5) platvormid ja andmetaristud ning 6) andmeühiskonnas tegutsev inimene (vt alajaotus „Raamatu ülesehitus: meetodid, mõtteviisid ja muutused“). Selline jaotus on kahtlemata üks paljudest võimalikest. Seetõttu loodame raamatu koostajate ja kaasautoritena, et diskussioonid andmeühiskonna uurimise parimate lahenduste leidmise nimel jätkuvad.

Lisaks on pakutud postulaadid Eesti kontekstis esimene samm andmestumisega seotud muutuste mõtestamise suunas. Loodame, et see suunab ja toetab andmestumist mõtestavaid tegevusi ja toob kaasa järgnevad sammud nende edasiarendamiseks. Meie hinnangul loob nende kümne põhimõtte ning kuue käsitlusviisi läbikaalumine vundamendi heade andmepõhiste lahenduste loomiseks ning aitab loodetavasti ära hoida soovimatuid tagajärgi.

Järgnevalt tutvustame andmestunud ühiskonna uurimise postulaate ja nendega kaasnevat pisut lähemalt.

Andmestumine ja andmepööre

Käesolevas kogumikus mõistame andmeid ja andmestumist kui ontoloogilist (andmed kui loodud reaalsus või selle konstrueerimise vahend), epistemoloogilist (andmed kui teadmise viis) ja sageli ka ideoloogilist protsessi. Rahvusvahelistes uuringutes on eksperdid defineerinud ühiskonna andmestumist eelkõige kui kõigi ja kõige viimist struktureeritud andmeformaati, mis omakorda võimaldab ja soosib kvantifitseerimist (vt nt Dijck et al. 2018; Schäfer 2016; Lupton 2020). Sageli väidetakse, et andmestumine kaasneb paratamatult teiste maailmas toimuvate muutustega, nagu digitaliseerimine ja võrgustamine.

Lihtsustatult võib väita, et infotehnoloogia vahendusel sooritatud tegevusest jäävad maha „andmepurust rajad“. Ehkki nende teket on paljudes avalikes ja ka professionaalsetes keskusteludes kombeks paratamatuks pidada, soovitavad kriitilised käsitlused (D’Ignazio, Klein 2020) alati küsida, kelle kätte koonduvad andmed, kas sellega kaasneb võimu koondumine, ning kas seesinane koondumine ja seda soosiv süsteem peaks ikka eksisteerima. Eriti aktuaalseks on sellised küsimused muutunud näiteks USA ja Hiina näotuvastustehnoloogiate ja ennustava politseitöö teemalistes vestlustes. Lisaks võiks iga andmeagent (andmete looja, kasutaja, nendega töötav või neid uuriv isik) endalt küsida, kas andmepuru kogumine, arhiveerimine, agregeerimine ja teatud eesmärkidel kasutamine on paratamatu ja vajalik. Kui midagi on võimalik andmeteks muuta, ei tähenda see tingimata, et see on hea idee. Andmestumise protsessilisusest tulenevalt olemegi sõnastanud andmestunud maailma mõistmise esimese postulaadi: andmete loomine, kogumine ja kasutamine on keeruline sotsiaalne protsess, kus andmeanalüütik (andmete põhjal otsustaja) peab arvestama andmete loodud sotsiaalse reaalsusega, sh sageli vastuoluliste ja hierarhiliste andmesuhetega.

 

Andmete ja ühiskonna vahelised seosed on keerulised. Ühest küljest luuakse andmeid inimeste elus ja ühiskonnas toimuvate protsesside põhjal ning neid kasutatakse samade protsesside analüüsimiseks ja mõtestamiseks; nii vaadates on andmed ühiskonna osa. Teisalt tekivad andmestumise baasilt täiesti uued ühiskondlikud nähtused. Seega on oluline, millisest perspektiivist lähtuvalt tõlgendatakse muutuste selgitamisel andmete ja ühiskonna omavahelist suhet (vt nt Beraldo, Milan 2019) – kas ühiskondlikud protsessid on andmete ja andmetehnoloogiate poolt juhitud (data-driven), andmetel põhinevad (data-based) või andmetest informeeritud (data-informed) (vt ka ptk 1.1). Esimesel juhul eeldatakse, et andmed ja andmetehnoloogiad tingivad teatud nähtusi (näiteks kui algoritmid filtreerivad ja vormivad inimeste juurdepääsu informatsioonile, millel võivad olla laiaulatuslikud sotsiaalsed, poliitilised ja võrdset kohtlemist puudutavad tagajärjed). Teisel juhul on andmed vaid formaalne infrastruktuur, mis loob aluse otsuste tegemiseks, näiteks teadlike valikute tegemisel algoritmide poolt filtreeritud informatsiooni kontekstis. Nii oleme sõnastanud andmestunud maailma uurimise teise postulaadi: võrgustunud ja omavahel tihedas seoses olevad protsessid ei pruugi olla selgitatavad lineaarsete tõlgenduste ja meetodite kaudu, vaid üha enam tuleb tähelepanu pöörata tegutsejate võrgustikule, mis võimaldab selgitada andmestumisega seotud keerukaid nähtusi ja võimalusi mitmetasandiliste ja üksteisega põimunud seoste kaudu.

Ühiskondlikult oluliste tegevuste kvantifitseerimises pole iseenesest midagi uut: valitsejad on maksukogumiseks andmeid kogunud tuhandeid aastaid, kirikud kogusid ja avaldasid aastasadu surnute andmebaase. Ka nende näidete puhul võib väita, et andmesubjektide kohta teadmiste koondamisega kaasnes võimu koondumine nende kätte, kelle kätte koondusid andmed (D’Ignazio, Kelin 2020). Siiski võib tänase andmestumise üheks alguspunktiks märkida arvutustehnoloogiate kasutuselevõtu rahvaloendusandmete töötlemisel. Herman Hollerithi 1890. aastal USA-s välja töötatud arvutusmasin (vt nt Whitby 2020) võimaldas rahvaloenduse tulemustest kokkuvõtte teha mõne kuuga varasema kaheksa aasta asemel. Seega võib andmestumist selgitada lainetena toimuva tehno-sotsiaalse muutusena (Schot, Kanger 2018), mis digitaliseerumise (Archer 2015), meediastumise3 (Hepp 2020) ja ühenduvusega (connectivity) (Couldry, Meijas 2019) seoses on järjekordse transformatsiooni läbi teinud. Käimasolevat andmestumiselainet peetakse eripäraseks (Just, Latzer 2017) johtuvalt selle skaalast ja ulatusest, mistõttu on praeguse andmestumisega kaasnenud suurem killustumine, kaubastumine, ebavõrdsus ja riigipiiride hägustumine ning vähenenud andmetega seotud protsesside läbipaistvus, kontrollitavus ja ennustatavus. Andmestumine ei ole passiivne (datafied), vaid aktiivne protsess (datafying), milles on oma võitjad ja kaotajad.

Eestis on andmestumine nähtavamaks muutunud seoses Euroopa andmekaitseseadusega (EP 2016), mille jõustumise ning kaasnevate piirangute tõttu on era- ja avaliku sfääri institutsioonid, aga ka n-ö andmesubjektideks peetavad indiviidid, kelle isikuandmeid kogutakse, hoitakse või töödeldakse (sageli mh nende enese teadmata), saanud teadlikumaks andmekasutamisega seotud võimalustest, ohtudest ja piirangutest. Selline areng on Eestis tõstatanud järgmised küsimused: Kas ja mis tingimustel on lubatud erafirmadel andmeid kasutada ja analüüsida? Kuidas teha andmed kättesaadavaks teadusuuringute jaoks? Kuidas tagada avatud andmete liikumine avaliku sektori institutsioonidele ja kodanikuaktivistidele? Kas ärilistel ja teaduslikel eesmärkidel andmete kogumisele peaks rakenduma erinevad piirangud? Ka siinses raamatus käsitletakse andmete kasutamise printsiipe, näiteks andmete õiguslikku kaitset ja kasutamist (ptk 1.3), andmete kasutamisega seotud eetilisi põhimõtteid (ptk 1.4) ning andmetega seotud sotsiaalse õigluse küsimusi (ptk 1.1). Sellest lähtuvalt oleme sõnastanud ka andmestunud maailma uurimise kolmanda postulaadi: andmestunud maailmas pole andmetaristu üksnes institutsionaalne omand, vaid võimalus avaliku hüve loomiseks, andmetes leiduva mitmekesisuse kaudu sotsiaalse mitmekesisuse tagamiseks ning andmepõhiste muutuste strateegiliseks juhtimiseks.

Raamatu koostajatena väidame, et andmed ja andmetes esindatud isikud pole teineteise teisikud (data doubles; vt Raley 2013; Goriunova 2019). Pigem peegelduvad andmekogudes uurijate väärtused ning (kohati aegunud) arusaamad sotsiaalsete kategooriate (sugu, rass, sissetulek, vanusegrupp, haridustase) tõlgendusjõust. Kuigi andmestumine loob loendamatud andmekogud ja teoreetilise võimaluse haarata ühiskondlikku elu kogu selle mitmekesisuses, jääb andmete mitmekesisuse küsimus sageli tähelepanuta. Andmestumine lähtub suuresti põhimõttest, et sotsiaalne reaalsus jaotatakse piiratud kategooriatesse. Ka klassikaline arvutusteaduslik meetod baseerub dihhotoomsele ehk 0–1 jaotusele ja arusaamale maailmast. Varasemalt kasutatud binaarsed kategooriad (nt 1 – õige, 2 – vale) on andmete puhastamisel, korrastamisel ja tõlgendamisel endiselt kasutusel, selmet püüelda andmete lõpmatus mitmekesisuses leiduva intersektsionaalsuse kajastamise poole (Hopkins 2019). Andmestunud ühiskonna teadmusloome (Shaw 2015; Wagner-Pacifici et al. 2015) eeldab andmete käsitlemist nii epistemoloogilise kui ka ontoloogilise nähtusena, ent tekitab lisaks hulga andmeõigluslikke (data justice) küsimusi, mille eesmärk on kindlustada, et andmed tagaks senisest suurema, mitte väiksema sotsiaalse õigluse. Nende diskussioonide põhjal oleme sõnastanud andmestunud maailma mõistmise neljanda postulaadi: lisaks tavapärastele teaduseetika nõuetele (uuritavate kahjustamise vältimine) peab andmete kogumine, analüüsimine ja tõlgendamine olema andmesubjekti ja ühiskonna seisukohalt õigustatud ja õiglane.

Eesti ühiskond pakub suurepärase võimaluse andmestumisega seotud arengusuundade analüüsiks – ühest küljest ollakse Eestis andme- ja tehnoloogiausust kannustatuna altid katsetama uudseid andmetehnoloogiaid (Runnel et al. 2009; Shaw 2015), teisalt on Eesti maailma kontekstis olnud suhteliselt tagasihoidlik valitsuse avaandmete arendamisel (McBride et al. 2018). Probleemiks on olnud eelkõige era- ja avaliku sektori ebavõrdne juurdepääs andmeressurssidele, aga ka erinevad arusaamad avalikest väärtustest ja sotsiaalsetest normidest andmelahenduste väljatöötamisel (Männiste, Masso 2020). Meil on eeskujulik digitaalne riigihaldus ja e-valitsemise taristu, ent erasektori digiteeritus on ebaühtlane ning kultuuripärandi lausdigiteerimise ja avaandmestamise algatused kipuvad venima (vt ptk 5.1).

Siiski on Eesti olnud teerajaja mitut tüüpi andmete kasutuselevõtmisel ja nende analüüsiks vajalike meetodite arendamisel. Mobiiltelefonide kõnetoiminguandmed ja mobiilpositsioneerimine sotsiaal-ruumilise segregatsiooni analüüsimiseks (Ahas et al. 2007) on üks eredaim näide (vt ptk-d 5.4 ja 2.1). Eesti digitehnoloogiate edusamme ja uuenduslikke andmelahendusi on kasutatud isegi riigi rahvusvaheliseks brändimiseks (Tammpuu, Masso 2018; Männiste, Masso 2020). Selle hiljutiseks näiteks on Eesti tehisintellekti ehk krattide lahendused.

Paljud Eesti teadlased ja selle kogumiku autorid on oma erialal uurimismeetodite edasiarendamises ja nendega eksperimenteerimises esirinnas, luues lahendusi, mida kasutavad kolleegid ja tudengid rahvusvaheliselt. Käesolev raamat esitab ülevaate Eestis välja pakutud andmestunud maailma uurimise viisidest, mis on kohandatavad rahvusvaheliselt, kuid eelkõige loodud Eesti ühiskonda arvestades. Kuna andmelahendused on loodud konkreetses sotsiaalses kontekstis, on ka andmestunud maailma mõistmise viiside korral oluline lähtuda konkreetse riigi kontekstist. Nende eelduste põhjal oleme sõnastanud viienda postulaadi: andmestunud maailma mõistmiseks – uuringu planeerimisel, andmete kogumisel, analüüsimisel ja tõlgendamisel – on oluline arvestada uuritava nähtuse ja andmete sotsiaal-kultuurilise kontekstiga.

1Peatüki kirjutamist on toetanud Tallinna Tehnikaülikooli arenguprogramm Astra aastateks 2016–2022 (2014–2020.4.01.16-0032).
2Kuna enamik teaduskirjandust ilmub inglise keeles, siis on üldjuhul siin ja edaspidi eestikeelsete terminite juures esitatud ka ingliskeelne vaste.
3Meediastumine on sotsiaalse maailma ja selle eri protsesside aina tihenev seotus meediaga.