Kodėl atvirų duomenų ignoravimas kainuoja brangiai
Daugelis žurnalistų vis dar rašo istorijas remdamiesi vien šaltinių citatomis ir savo intuicija. Tai nėra blogai – bet kai šalia guli tūkstančiai viešai prieinamų duomenų rinkinių, kurie galėtų patvirtinti arba visiškai paneigti jūsų prielaidas, jų nepanaudojimas atrodo kaip kelio žemėlapio atsisakymas keliaujant nepažįstamoje šalyje.
Atvirų duomenų žurnalistika – tai ne kažkokia egzotiška disciplina. Tai tiesiog įprotis klausti: ar yra skaičių, kurie tai patvirtina?
Kur ieškoti – ir ką rasti
Lietuvoje pagrindinė stotelė yra data.gov.lt – oficialus valstybės atvirų duomenų portalas. Ten rasite viską nuo savivaldybių biudžetų iki kelių eismo įvykių statistikos. Europos mastu veikia data.europa.eu, kuris agreguoja duomenis iš visų ES šalių.
Praktiškai naudinga žinoti kelis dalykus:
- Duomenys dažnai būna CSV arba JSON formatais – juos galima atidaryti net paprastu Excel
- Metaduomenys (aprašymai prie kiekvieno rinkinio) pasakys, kada duomenys atnaujinti ir kas juos rinko
- Seni duomenų rinkiniai gali būti nebeaktualūs – visada tikrinkite datą
Taip pat verta nepamiršti Registrų centro, Statistikos departamento ir Seimo informacinių sistemų – ten slypi istorijos apie įmonių savininkus, demografinius pokyčius ir balsavimų rezultatus.
Nuo duomenų iki istorijos – kaip tai veikia praktiškai
Tarkime, rašote apie tai, kaip auga maisto kainų skirtumas tarp Vilniaus ir regionų. Intuicija sako – skirtumas yra. Bet koks? Statistikos departamento duomenys leis ne tik patvirtinti faktą, bet ir pasakyti konkrečiai: bulvių kaina Vilniuje vidutiniškai X procentų didesnė nei Marijampolėje. Tai jau istorija, o ne spėjimas.
Procesas paprastai atrodo taip:
- Suformuluokite klausimą – ne „noriu rašyti apie švietimą”, o „ar mokyklų finansavimas priklauso nuo savivaldybės turtingumo?”
- Suraskite atitinkamą duomenų rinkinį – švietimo ministerijos biudžeto duomenys, savivaldybių pajamų statistika
- Palyginkite ir ieškokite anomalijų – kur skaičiai „netelpa” į bendrą tendenciją, ten dažnai slypi istorija
- Grįžkite prie žmonių – duomenys parodo kas vyksta, šaltiniai paaiškina kodėl
Paskutinis žingsnis yra kritiškai svarbus. Duomenys be konteksto gali klaidinti. Jei viena savivaldybė gauna mažiau lėšų mokyklai, tai nebūtinai reiškia diskriminaciją – galbūt ten tiesiog mažiau mokinių. Visada klauskite: ar šis palyginimas yra sąžiningas?
Dažniausios klaidos, kurios gadina gerą istoriją
Pirma ir bene labiausiai paplitusi – painioti koreliaciją su priežastingumu. Jei du rodikliai auga kartu, tai dar nereiškia, kad vienas lemia kitą. Šią klaidą daro net patyrę žurnalistai.
Antra klaida – pasitikėti duomenimis aklinai. Valstybiniai duomenys kartais turi spragų, klaidų ar yra renkami metodais, kurie iškraipo realybę. Visada verta pasitikrinti su nepriklausomais ekspertais.
Trečia – paskęsti skaičiuose ir pamiršti istoriją. Duomenų žurnalistika nėra statistikos ataskaita. Skaičiai turi tarnauti pasakojimui, o ne jį užgožti.
Kai duomenys tampa žurnalistikos stuburu
Atvirų duomenų naudojimas keičia ne tik tai, kaip rašomos istorijos – jis keičia santykį su skaitytoju. Kai teiginys remiasi patikrinamu šaltiniu, kurį kiekvienas gali atidaryti ir pasitikrinti, pasitikėjimas žiniasklaida auga. O tai šiandien nėra mažas dalykas.
Pradėti nereikia nuo didelių projektų. Užtenka kito karto, kai rašysite apie kokią nors problemą, papildomai skirti 20 minučių ir paieškoti – ar nėra duomenų, kurie šią problemą parodo konkrečiau. Dažnai jų yra. Ir dažnai jie pasakoja kiek kitokią istoriją, nei tikėjotės – o tai, kaip žinome, ir yra geriausia žurnalistika.