Kas tie atvirieji duomenys ir kodėl jie svarbūs
Atvirieji duomenys – tai informacija, kurią valstybinės institucijos, tarptautinės organizacijos ar kitos struktūros skelbia viešai ir leidžia naudoti be apribojimų. Biudžeto išlaidos, viešųjų pirkimų sutartys, aplinkosaugos matavimai, demografinė statistika – visa tai gali tapti žurnalistinės istorijos pagrindu arba tyrimo atspirties tašku.
Problema ta, kad daugelis žurnalistų ir tyrėjų šiuos šaltinius ignoruoja – arba nežino, kur ieškoti, arba mano, kad darbas su duomenimis reikalauja specialių techninių žinių. Iš dalies tai tiesa, bet tik iš dalies.
Kur ieškoti
Lietuvoje pagrindinis atvirųjų duomenų portalas yra data.gov.lt. Ten rasite tūkstančius duomenų rinkinių – nuo savivaldybių išlaidų iki kelių eismo įvykių statistikos. Europos Sąjungos lygmeniu veikia data.europa.eu, o globaliai – tokios platformos kaip Our World in Data arba World Bank Open Data.
Verta žinoti ir apie sektorines duomenų bazes. Aplinkosauginiams tyrimams tinka Europos aplinkos agentūros duomenys, finansiniams – Registrų centro ar Sodros skelbiama informacija. Viešųjų pirkimų srityje CVP IS sistema leidžia sekti, kas ir už kiek perka iš valstybės biudžeto.
Kaip dirbti su tuo, ką radote
Duomenų radimas – tik pusė darbo. Dažnai failai būna nepatogaus formato: sulaužytos lentelės, skirtingos datos, dubliuoti įrašai. Prieš darant bet kokias išvadas, reikia suprasti, kaip duomenys buvo renkami ir kas juos tvarkė. Metodologinės klaidos ar sąmoningi praleidimai gali iškreipti visą vaizdą.
Paprasčiausiems analizės darbams pakanka Excel arba Google Sheets. Jei duomenų daug – pravartu išmokti bent pagrindines Python arba R bibliotekas. Vizualizacijai tinka Datawrapper – įrankis, kurį naudoja daugelis Europos redakcijų ir kuris nereikalauja programavimo žinių.
Svarbu nepamiršti konteksto. Skaičius pats savaime nieko nesako – jis įgyja prasmę tik lyginamas su kitu laikotarpiu, kita šalimi ar kitu rodikliu. Čia ir prasideda tikrasis žurnalistinis darbas.
Kai duomenys tampa istorija
Geriausi duomenimis pagrįsti tekstai nėra tie, kuriuose daugiausia statistikos. Jie – tie, kuriuose skaičiai padeda pamatyti kažką, ko kitaip nepastebėtum. Korupcijos schema, kuri išryškėja iš viešųjų pirkimų šablonų. Regioninė nelygybė, kurią atskleidžia sveikatos rodikliai. Aplinkos tarša, kurią patvirtina matavimų eilutės.
Atvirieji duomenys nėra stebuklingas įrankis – jie neatleidžia nuo šaltinių paieškos, pokalbių su žmonėmis ar kritinio mąstymo. Bet jie gali suteikti tai, ko žurnalistikoje visada trūksta: tvirtą pagrindą, nuo kurio galima stumtis toliau.