Kas tie atvirieji duomenys ir kodėl tai svarbu
Atvirieji duomenys – tai viešai prieinami duomenų rinkiniai, kuriuos valdžios institucijos, mokslo organizacijos ar kitos struktūros skelbia be didelių apribojimų. Lietuvoje tai gali būti Registrų centro informacija, Statistikos departamento lentelės, savivaldybių biudžetų ataskaitos ar net Seimo balsavimų istorija. Visa tai legaliai prieinama, nemokama ir dažnai – visiškai nepanaudota.
Žurnalistams tai reiškia vieną dalyką: istorijos, kurios anksčiau reikalavo ilgų tyrimų ar šaltinių tinklo, dabar kartais telpa keliuose CSV failuose. Reikia tik žinoti, kur žiūrėti ir ką su tuo daryti.
Kur ieškoti duomenų
Pradėti verta nuo data.gov.lt – oficialaus Lietuvos atvirųjų duomenų portalo. Ten rasite tūkstančius rinkinių: nuo kelių eismo įvykių iki švietimo statistikos. Europos Sąjungos lygmeniu veikia data.europa.eu, kur galima palyginti Lietuvos rodiklius su kitomis šalimis.
Taip pat verta nepamiršti institucijų svetainių tiesiogiai – Finansų ministerija, Sveikatos apsaugos ministerija, Valstybinė mokesčių inspekcija dažnai skelbia duomenis, kurie į centrinį portalą dar nepatenka arba patenka su vėlavimu. Reikia šiek tiek kantrybės, bet tai apsimoka.
Nuo duomenų iki istorijos
Čia daugelis sustoja. Atsisiuntė failą, atidarė – o ten tūkstančiai eilučių skaičių. Ką daryti toliau?
Pirmas žingsnis – suprasti, ką duomenys iš tikrųjų matuoja. Skaitykite metodologinius aprašus, net jei jie nuobodūs. Klaidingai interpretuoti duomenys – blogiau nei jų neturėti.
Antras žingsnis – ieškoti anomalijų. Kur staigiai pakilo ar krito rodiklis? Kuri savivaldybė išsiskiria iš bendro vaizdo? Anomalija nėra pati istorija, bet ji yra geras klausimas, kurį reikia užduoti žmonėms.
Trečias žingsnis – duomenis papildyti žmonėmis. Statistika pasakoja, kas nutiko. Žmonės pasakoja, kodėl ir kaip. Vieno be kito nepakanka.
Praktiniai įrankiai, kurių nereikia bijoti
Nereikia būti programuotoju. „Excel” ar „Google Sheets” pakanka daugeliui užduočių – rūšiavimui, filtravimui, paprastiems skaičiavimams. Vizualizacijoms tinka „Datawrapper” – intuityvi platforma, kurioje diagramą galima sukurti per dvidešimt minučių.
Jei duomenų rinkiniai dideli arba reikia sujungti kelis šaltinius, verta pažiūrėti į „OpenRefine” – nemokamą įrankį duomenų valymui. Tai ta negraži, bet būtina darbų dalis, apie kurią retai kalba.
Kai duomenys meluoja
Atvirieji duomenys nėra tiesa savaime. Jie atspindi tai, kaip institucija nusprendė kažką matuoti, kokius klausimus uždavė, ką nusprendė įtraukti ir ko – ne. Skirtingos metodologijos skirtingais metais gali padaryti palyginimą beprasmį. Duomenų spragos gali rodyti ne tikrovę, o tiesiog tai, kad niekas neskaičiavo.
Kritiška akis čia svarbesnė nei techniniai įgūdžiai.
Tai ne ateitis – tai jau dabar
Duomenimis grįsta žurnalistika Lietuvoje dar nėra norma, bet tai keičiasi lėtai ir pastebima. Redakcijos, kurios išmoksta dirbti su atviraisiais duomenimis, gauna konkurencinį pranašumą – ne todėl, kad tai madinga, o todėl, kad tai leidžia pamatyti tai, ko kiti nemato. Istorijos, kurios kyla iš duomenų, dažnai yra sunkiau ginčijamos ir sunkiau ignoruojamos. O tai, galiausiai, ir yra esmė.