Atviri duomenys – ne stebuklas, bet įrankis
Žurnalistai mėgsta kalbėti apie atvirų duomenų revoliuciją. Konferencijose skamba gražios frazės apie skaidrumą, pilietinę žiniasklaidą ir duomenimis pagrįstą žurnalistiką. Realybė? Dauguma vietinių redakcijų vis dar rašo straipsnius remdamosi vieno savivaldybės atstovo spaudos konferencija, o atvirų duomenų portalai dulka nenaudojami.
Tai nėra vien tingėjimo problema. Daugelis žurnalistų tiesiog nežino, nuo ko pradėti. Duomenų rinkmenos atrodo bauginančiai, o laiko visada trūksta. Bet čia ir slypi esmė – atviri duomenys nereikalauja, kad būtum programuotojas ar statistikas. Reikia tik žinoti, kur žiūrėti ir kaip klausti tinkamų klausimų.
Kur ieškoti ir ko tikėtis
Lietuvoje veikia data.gov.lt – oficialus atvirų duomenų portalas. Teoriškai ten turėtų būti visa, ko reikia: viešųjų pirkimų duomenys, demografinė statistika, aplinkosaugos rodikliai, savivaldybių biudžetai. Praktiškai – dalis duomenų pasenusi, dalis neišsami, o kai kurie rinkiniai paskutinį kartą atnaujinti prieš kelerius metus. Tai nėra priežastis atsisakyti, bet tai yra priežastis būti kritiškam.
Europos atvirų duomenų portalas (data.europa.eu) dažnai siūlo geriau sustruktūruotus rinkinius, ypač kai reikia palyginti Lietuvos rodiklius su kitomis ES šalimis. Jei rašai apie oro kokybę Vilniuje, gali iš karto palyginti su Ryga ar Talinu – tai suteikia kontekstą, kurio vietiniai šaltiniai paprasčiausiai negali duoti.
Viešųjų pirkimų registras – tai atskira istorija. CVP IS sistema yra nepatogi, lėta ir vizualiai primena 2005-uosius, bet joje slypi daugybė istorijų. Kurios įmonės laimi konkursus toje pačioje savivaldybėje vėl ir vėl? Kiek kainuoja tas pats paslaugų paketas skirtinguose miestuose? Šie klausimai patys savaime yra žurnalistiniai tekstai.
Praktika be romantikos
Pradėkime nuo to, kas iš tikrųjų veikia. Paimk konkrečią temą – tarkime, gatvių remontą tavo mieste. Savivaldybės svetainėje rasi biudžeto eilutes, CVP IS – pirkimų sutartis, o „Rekvizitai.lt” ar „Registrų centras” – informaciją apie rangovus. Sujunk šiuos tris šaltinius ir jau turi pagrindą istorijui, kurią niekas kitas dar nepapasakojo.
Svarbu suprasti vieną dalyką: duomenys nekalba patys. Jie rodo skaičius, bet ne priežastis. Jei savivaldybė išleido 40% daugiau keliams remontuoti nei pernai, tai gali reikšti korupciją, gerą planavimą arba tiesiog brangstančias medžiagas. Duomenys kelia klausimą – atsakymą turi rasti tu, kalbėdamas su žmonėmis.
Dar vienas praktinis patarimas: neimk per daug iš karto. Pradedantys duomenų žurnalistai dažnai nori analizuoti viską ir iš karto. Rezultatas – savaitė praleista su Excel lentelėmis ir nė vieno parašyto teksto. Geriau pasirink vieną konkretų klausimą, vieną duomenų rinkinį ir vieną savaitę. Pirmoji istorija bus netobuła. Antroji – geresnė.
Techniniai minimumas be isterikos
Nereikia mokėti Python ar R. Rimtai. Excel arba „Google Sheets” pakanka 80% vietinės žurnalistikos atvejų. Mokėk rūšiuoti, filtruoti ir skaičiuoti procentus – to užtenka pradžiai. Jei nori daugiau, „OpenRefine” padeda išvalyti netvarkingus duomenis, o „Datawrapper” leidžia per 20 minučių sukurti padorią vizualizaciją.
Dažna klaida – publikuoti grafiką be konteksto. Diagrama, rodanti, kad savivaldybė išleido X eurų, nieko nesako, jei skaitytojas nežino, ar tai daug, ar mažai. Visada palygink: su praėjusiais metais, su kita savivaldybe, su planuotu biudžetu. Be palyginimo duomenys yra tik skaičiai.
Kai duomenys meluoja (arba tiesiog klysta)
Čia prasideda tikroji kritinė žurnalistika. Atviri duomenys nėra tiesa – jie yra vieno šaltinio versija. Savivaldybė gali skelbti statistiką, kuri yra techniškai teisinga, bet metodologiškai klaidinanti. Pavyzdžiui, bedarbystės rodikliai dažnai neskaičiuoja žmonių, kurie nustojo ieškoti darbo. Nusikalstamumo statistika priklauso nuo to, kiek nusikaltimų užregistruojama, o ne kiek jų įvyksta.
Todėl kiekvieną duomenų rinkinį reikia klausti: kas jį rinko? Kaip? Kokiu tikslu? Ar metodologija keitėsi laikui bėgant? Šie klausimai nėra paranoja – tai elementari žurnalistinė higiena.
Vietoj epilogo: kodėl tai svarbu būtent dabar
Vietinė žurnalistika Lietuvoje yra krizėje. Redakcijos mažėja, žurnalistų mažiau, o savivaldybių komunikacijos skyriai – atvirkščiai, auga. Tai reiškia, kad vis daugiau „naujienų” iš tikrųjų yra perredaguoti pranešimai spaudai. Atviri duomenys šiame kontekste nėra mados reikalas – jie yra vienas iš nedaugelio įrankių, leidžiančių žurnalistui dirbti savarankiškai, be priklausomybės nuo to, ką valdžia nori papasakoti.
Tai nėra lengva. Tai reikalauja laiko, kurį redakcijos neturi, ir įgūdžių, kurių niekas neišmokė. Bet alternatyva – toliau rašyti tekstus pagal savivaldybės pateiktą naratyvą – yra dar blogesnė. Duomenys nėra stebuklas ir nėra revoliucija. Jie yra paprasčiausiai geresnė žurnalistika. Ir to pakanka.