Kaip naudoti atvirus duomenis kuriant žurnalistinius tyrimus: praktinis vadovas pradedantiesiems

Atviri duomenys – žurnalisto ginklas, kurio daugelis tiesiog nepastebi

Įsivaizduok: sėdi redakcijoje, turi nuojautą, kad kažkas ne taip su viešaisiais pirkimais tavo mieste. Bet nuojauta – ne straipsnis. Faktai – straipsnis. Ir štai čia prasideda įdomiausia dalis, nes faktai dažnai guli tiesiai prieš tave – viešai, nemokamai, tik reikia žinoti, kur žiūrėti.

Atviri duomenys – tai informacija, kurią valstybė, savivaldybės ar kitos institucijos skelbia viešai ir kurią gali laisvai naudoti. Lietuvoje tai nėra kažkokia egzotika. data.gov.lt, Registrų centras, CVP IS (Centrinė viešųjų pirkimų informacinė sistema) – visa tai yra prieinami šaltiniai, kuriuos kol kas aktyviai naudoja daugiau analitikai nei žurnalistai. O gaila.

Nuo kur pradėti, kai duomenų per daug ir nieko neaišku

Pirmiausia – nustok galvoti, kad tau reikia būti programuotoju. Nereikia. Pradedantiesiems pakanka Excel arba Google Sheets ir noro šiek tiek pasiknisti.

Praktinis žingsnis: eik į cvpis.lrs.lt ir pasirink bet kurią savivaldybę. Išsifiltruk pirkimus pagal perkančiąją organizaciją ir pažiūrėk, kurie tiekėjai laimi dažniausiai. Ar tas pats vardas kartojasi? Ar kainos atrodo keistai vienodos? Tai jau yra istorija – arba bent jau klausimas, kurį verta užduoti.

Kitas šaltinis, kurį žurnalistai neįvertina – Juridinių asmenų registras. Ten gali patikrinti, kas iš tikrųjų stovi už įmonės, kuri laimi milijoninius konkursus. Kartais akcininkai turi labai įdomių ryšių su sprendimus priimančiais žmonėmis.

Duomenys meluoja rečiau nei žmonės – bet ir juos reikia tikrinti

Čia svarbu nepasiduoti pagundai: radai skaičių, kuris atrodo šokiruojantis – dar nereiškia, kad turi skandalą. Duomenys gali būti neteisingai įvesti, pasenę arba tiesiog neteisingai interpretuoti.

Pavyzdžiui, jei matai, kad viena įmonė gavo 90% visų pirkimų kažkurioje srityje – tai gali reikšti korupciją, bet gali reikšti ir tai, kad ji tiesiog vienintelė rinkoje, kuri teikia tą paslaugą. Duomenys kelia klausimus, o ne atsako į juos. Atsakymus turi rasti tu – per pokalbius, dokumentus, papildomus šaltinius.

Todėl dirbk taip: duomenys → hipotezė → tikrinimas → straipsnis. Ne atvirkščiai.

Įrankiai, kurie tikrai padeda (ir kurių nereikia bijoti)

Be jau minėtų lentelių, verta susipažinti su keliais dalykais:

  • OpenRefine – nemokama programa, kuri padeda išvalyti netvarkingus duomenis. Kai institucija eksportuoja failą, kuriame tas pats pavadinimas parašytas penkiais skirtingais būdais – tai tavo išsigelbėjimas.
  • Datawrapper – jei nori duomenis paversti vizualizacija, kurią galima įdėti į straipsnį. Paprasta, greita, atrodo profesionaliai.
  • OCCRP Aleph – tarptautinė platforma, kurioje galima ieškoti ryšių tarp įmonių ir asmenų per kelias šalis iš karto. Labai naudinga, kai tiriami tarptautiniai pinigų srautai.

Kodėl tai svarbu būtent dabar – ir ką tai reiškia tau

Žurnalistika šiandien kovoja dėl pasitikėjimo. Ir vienas geriausių būdų jį atgauti – rodyti darbą. Kai skaitytojui gali pasakyti „štai duomenys, štai kaip juos analizavome, štai ką radome” – tai visai kita kalba nei „mūsų šaltiniai teigia”.

Duomenimis pagrįsta žurnalistika nėra mada ar techninis triukas. Tai metodas, kuris leidžia pamatyti tai, ko nepamatysi per spaudos konferenciją ar oficialų komentarą. Tai istorijos, kurios kyla ne iš to, ką kažkas nori tau pasakyti, o iš to, ką skaičiai atskleidžia patys.

Pradėk mažai. Vienas klausimas, vienas duomenų rinkinys, vienas ryšys, kurį nori patikrinti. Ir labai tikėtina, kad po pirmojo tokio tyrimo grįžti prie senojo metodo tiesiog nebenorėsi.