Kaip naudotis atvirais duomenimis ieškant naujienų: praktinis vadovas žurnalistams ir aktyvistams

Duomenys – tai istorijos, kurios laukia, kol jas papasakosi

Kiek kartų girdėjai frazę „duomenys yra naujoji nafta”? Tikriausiai per daug. Bet čia yra tiesa, kurią verta pasakyti kitaip: atvirų duomenų šaltiniai yra pilni istorijų, kurias niekas dar nepapasakojo – ir dažniausiai todėl, kad niekas tiesiog nepasivargino pažiūrėti.

Žurnalistams ir aktyvistams tai reiškia vieną dalyką – neišnaudotą potencialą. Valstybiniai registrai, viešieji pirkimų duomenys, aplinkosaugos ataskaitos, biudžeto dokumentai… Visa tai yra prieinama. Nemokamai. Dabar.

Kur ieškoti ir ko tikėtis

Pradėkime nuo to, kas realiai veikia Lietuvoje ir Europoje. data.gov.lt – Lietuvos atvirų duomenų portalas – turi šimtus duomenų rinkinių nuo transporto iki sveikatos statistikos. Taip, kai kurie duomenys atnaujinami vangiai, kai kurie formatai primena 2005-uosius, bet ten yra aukso.

Europos lygmeniu data.europa.eu surenka duomenis iš visos ES – tai ypač naudinga, kai nori palyginti, kaip Lietuva atrodo kitų šalių kontekste. Viešųjų pirkimų duomenys iš CVP IS sistemos gali atskleisti, kas ir už kiek gauna valstybės užsakymus. Štai kur prasideda tikros istorijos.

Tarptautiniams tyrimams – OpenCorporates, OCCRP Aleph ir World Bank Open Data. Jei dirbai su korupcijos ar aplinkosaugos temomis, šie įrankiai nėra prabanga – jie yra būtinybė.

Kaip duomenis paversti istorija, o ne tik skaičių krūva

Čia daro klaidą dauguma. Parsisiunčia Excel failą su tūkstančiais eilučių ir… sustoja. Duomenys patys savęs nepapasakos – reikia žinoti, ko ieškoti.

Keletas praktinių žingsnių:

  • Pradėk nuo klausimo, ne nuo duomenų. „Ar savivaldybė perka prekes iš susijusių įmonių?” – tai klausimas. Tada eini ieškoti duomenų, kurie atsakytų.
  • Naudok Google Sheets arba Airtable, jei Excel atrodo bauginančiai. Filtravimas, rikiavimas, paprastos formulės – to dažnai pakanka.
  • Ieškok anomalijų. Vienas rangovas, gavęs 80% visų konkursų? Kaina, kuri tris kartus viršija rinkos vidurkį? Tai – kabliukai.
  • Kryžmink šaltinius. Vienas duomenų rinkinys retai pasakoja visą istoriją. Sujunk viešuosius pirkimus su įmonių registru – ir gausi vardus.

Teisinė pusė, kurios negalima ignoruoti

Atvirų duomenų naudojimas yra teisėtas – tai jų esmė. Tačiau yra niuansų. Asmens duomenys net ir viešuose registruose turi apsaugą pagal BDAR. Publikuodamas duomenis, visada pagalvok: ar tai viešo intereso informacija, ar privataus žmogaus detalės, kurios neturi reikalo būti viešos?

Aktyvistams papildoma mintis: duomenys gali būti įrodymas, bet teisiniame kontekste jų pateikimas turi savo taisykles. Konsultuokis su teisininkais, jei planuoji duomenis naudoti oficialiai.

Tai ne technologijų klausimas – tai drąsos klausimas

Galiausiai – ir tai svarbiausia – atvirų duomenų naudojimas nėra programuotojų ar duomenų mokslininkų privilegija. Tai įgūdis, kurį gali išmokti per savaitgalį. Ir ne, tau nereikia mokėti Python ar SQL, kad pradėtum.

Reikia tik vieno: noro pažiūrėti ten, kur kiti nepasivargins. Kiekvienas viešas dokumentas, kiekvienas duomenų rinkinys yra potenciali istorija, kuri gali pakeisti tai, kaip žmonės mato savo miestą, šalį ar valdžią. Žurnalistai ir aktyvistai, kurie tai supranta, jau turi pranašumą – ne todėl, kad turi geresnių įrankių, o todėl, kad užduoda geresnius klausimus. Pradėk nuo vieno klausimo. Duomenys ras kelią.