Kas tie atvirieji duomenys ir kodėl jie svarbūs žurnalistui
Atvirieji duomenys – tai informacija, kurią valstybinės institucijos, savivaldybės ar kitos organizacijos skelbia viešai ir nemokamai. Statistikos departamentas, Registrų centras, savivaldybių portalai – visa tai yra šaltiniai, kuriuos žurnalistas gali naudoti be jokių apribojimų. Problema ta, kad daugelis redakcijų šių duomenų tiesiog neliečia, nes atrodo, jog tai kažkas sudėtingo ir nuobodaus. Iš tikrųjų tai vienas galingiausių įrankių, kai reikia parašyti istoriją, kuri remiasi faktais, o ne tik vieno ar kito žmogaus nuomone.
Vietinės naujienos ypač daug gauna iš atvirųjų duomenų. Kodėl? Nes žmonės nori žinoti, kas vyksta jų mieste, rajone, gatvėje. O institucijos tą informaciją dažnai jau turi – tiesiog ji sėdi kažkokioje lentelėje, kurią niekas nepasivargino perskaityti.
Kur ieškoti duomenų: konkretūs šaltiniai
Lietuvoje pagrindiniai atvirųjų duomenų portalai yra data.gov.lt ir osp.stat.gov.lt (Statistikos departamentas). Registrų centro duomenys pasiekiami per regia.lt. Savivaldybės dažnai turi savo atskirus skaidrumo ar biudžeto portalus – verta patikrinti savo miesto svetainę.
Jei rašai apie eismą – žiūrėk į Lietuvos automobilių kelių direkcijos duomenis. Apie kriminalinę situaciją – Policijos departamentas skelbia statistiką. Apie švietimą – Švietimo valdymo informacinė sistema (ŠVIS). Sveikatos tema? Higienos instituto duomenų bazės. Kiekviena sritis turi savo šaltinį, tik reikia šiek tiek paieškoti.
Kaip dirbti su duomenimis žingsnis po žingsnio
Pirmas žingsnis – rask klausimą, ne duomenis. Dažna klaida – žurnalistas atsidaro lentelę ir bando sugalvoti, apie ką rašyti. Geriau atvirkščiai: pradėk nuo klausimo. Pavyzdžiui, „ar mūsų mieste daugėja eismo įvykių prie mokyklų?” Tada ieškok duomenų, kurie į tą klausimą atsakytų.
Antras žingsnis – atsisiųsk ir išvalyk duomenis. Dažniausiai jie būna CSV arba Excel formato. Atsidaryk „Google Sheets” ar „Excel” ir pirmiausia pažiūrėk, ar nėra tuščių langelių, dublikatų ar keistų reikšmių. Tai užtrunka, bet be šio žingsnio rizikuoji padaryti klaidingą išvadą.
Trečias žingsnis – ieškoki tendencijų, o ne tik skaičių. Vienas skaičius nieko nepasako. Jei šiemet įvyko 45 eismo įvykiai, tai daug ar mažai? Palygink su praėjusiais metais, su kitu miestu, su šalies vidurkiu. Kontekstas – tai tas dalykas, kuris skaičių paverčia istorija.
Ketvirtas žingsnis – patikrink su žmonėmis. Duomenys parodo, kas vyksta, bet ne visada kodėl. Rask ekspertą, gyventoją ar pareigūną, kuris galėtų paaiškinti, ką tie skaičiai reiškia praktiškai. Duomenys be žmogaus balso – tai tik statistika, ne žurnalistika.
Penktas žingsnis – vizualizuok, jei gali. Net paprasčiausia diagrama padeda skaitytojui greičiau suvokti informaciją. „Datawrapper” įrankis yra nemokamas, lietuviškas sąsajas palaiko ir leidžia per kelias minutes sukurti aiškią grafiką.
Dažniausios klaidos, kurių geriau išvengti
Viena iš labiausiai paplitusių klaidų – painioti absoliučius skaičius su procentais. Jei viename rajone nusikaltimai išaugo 50%, o kitame – 10%, tai dar nereiškia, kad pirmasis rajonas pavojingesnis. Gali būti, kad bazė buvo labai maža.
Kita problema – seni duomenys. Visada tikrink, kada informacija buvo atnaujinta. Kai kurie portalai rodo duomenis, kurie gali būti ir dvejų metų senumo.
Ir paskutinis dalykas – nepersistengk su technine kalba straipsnyje. Skaitytojui nerūpi, kaip tu filtravai duomenis. Jam rūpi, ką tie duomenys reiškia jo gyvenimui.
Kai skaičiai tampa istorija
Atvirieji duomenys nėra stebuklingas receptas, bet jie suteikia žurnalistui tai, ko dažnai trūksta – patikimą pagrindą. Vietinės naujienos per dažnai remiasi tik oficialiais pranešimais ar atsitiktiniais komentarais. Kai turi duomenis, gali užduoti tikslesnius klausimus, pastebėti tai, ko kiti nepastebėjo, ir parašyti istoriją, kuri tikrai kažką pasako apie bendruomenę. Tai ne apie tai, kad būtum duomenų mokslininkas – tai apie tai, kad būtum geresnis žurnalistas. O pradėti galima jau šiandien, atidarant bet kurį iš minėtų portalų ir tiesiog paieškant, kas ten yra.