Kodėl atvirų duomenų portalai – tai ne tik vyriausybės reikalas
Kai pirmą kartą išgirdau apie atvirų duomenų portalus, pagalvojau: „Na ir kas? Dar vienas biurokratinis dalykas, kuris man tikrai nereikalingas.” Bet žinot ką? Buvau neteisus. Ir labai. Po kelių mėnesių, kai pradėjau gilintis į savo verslo analitiką ir ieškoti būdų, kaip priimti geresnius sprendimus nesišvaistant pinigais brangiai rinkos analizei, supratau, kad atvirų duomenų portalai – tai tarsi aukso kasykla, tik nemokamai prieinama.
Problema ta, kad dauguma žmonių net nežino, jog tokie portalai egzistuoja. O tie, kurie žino, dažnai neturi supratimo, kaip juos praktiškai panaudoti. Aš pats priklausiau tai kategorijai – žinojau, kad kažkas ten yra, bet atrodė per sudėtinga, per techniška, per… na, tiesiog ne man.
Tiesą sakant, atvirų duomenų portalai – tai vyriausybinės ir kitų institucijų iniciatyvos, kuriose skelbiami įvairūs duomenų rinkiniai viešai prieinami visiems. Lietuvoje turime data.gov.lt, Europos Sąjungoje – data.europa.eu, o pasaulyje tokių portalų – šimtai. Ten rasite viską: nuo demografinių duomenų iki transporto srautų, nuo verslo statistikos iki aplinkosauginių rodiklių.
Nuo ko pradėti: pirmieji žingsniai be galvos skausmo
Gerai, dabar kai supratote, kas tai yra, kyla klausimas – kaip pradėti? Aš pirmą kartą atsidaręs data.gov.lt portalą tiesiog sustingau. Tiek daug informacijos, tiek daug skirtingų formatų, tiek daug… visko. Jaučiausi kaip vaikas, kuris pirmą kartą pateko į didžiulę žaislų parduotuvę ir nežino, kur žiūrėti.
Štai kaip aš rekomenduoju pradėti (ir kaip pats turėjau pradėti, o ne blaškyti valandas be tikslo):
Pirma, suformuluokite konkretų klausimą ar problemą. Ne „noriu daugiau duomenų”, o „noriu suprasti, ar mano rajone auga gyventojų skaičius” arba „noriu žinoti, kokia konkurencija mano srityje”. Konkreti problema – konkreti paieška.
Antra, pradėkite nuo vieno portalo. Jei esate Lietuvoje ir jus domina Lietuvos rinka – pradėkite nuo data.gov.lt. Nesiblaškykite po visus pasaulio portalus iš karto. Vienas portalas, viena problema, vienas duomenų rinkinys.
Trečia, išmokite naudoti paieškos funkciją. Skamba banaliai, bet daugelis žmonių tiesiog naršo kategorijas ir paskui skundžiasi, kad nieko neranda. Įveskite raktažodžius, susijusius su jūsų verslu ar problema. Pavyzdžiui, jei turite kavinę, ieškokite „maitinimas”, „turizmas”, „gyventojai”, „pajamos”.
Kokie duomenys iš tiesų naudingi verslui (ir kaip juos rasti)
Dabar pereikime prie konkretybių. Kokius duomenis turėtumėte ieškoti, priklausomai nuo jūsų verslo tipo? Čia pasidalinsiu savo patirtimi ir tuo, ką esu matęs veikiant praktikoje.
Jei turite fizinę parduotuvę ar paslaugų verslą, jums bus neįkainojami demografiniai duomenys. Gyventojų skaičius pagal rajonus, amžiaus struktūra, pajamų lygis – visa tai padės suprasti, ar jūsų tikslinė auditorija yra ten, kur manote. Aš pažįstu vieną žmogų, kuris planavo atidaryti sporto klubą vienoje Vilniaus dalyje, bet pažiūrėjęs į demografinius duomenis suprato, kad ten gyvena daugiausia vyresnio amžiaus žmonės. Sutaupė nemažai pinigų nedarydamas klaidos.
Jei prekiaujate internetu, jums pravers duomenys apie internetinę prieigą, e-komercijos tendencijas, pašto paslaugų statistika. Pavyzdžiui, Statistikos departamento duomenys apie internetinę prekybą gali parodyti, kaip auga ar mažėja jūsų sektorius.
Jei teikiate B2B paslaugas, ieškokite verslo registro duomenų, įmonių statistikos, ekonominių rodiklių. Galite sužinoti, kiek naujų įmonių registruojama jūsų srityje, kokios jų pajamos, kiek darbuotojų jos turi. Tai padeda identifikuoti potencialius klientus ir suprasti rinkos dydį.
Transporto ir logistikos verslui – transporto srautų duomenys, kelių būklės informacija, oro uostų statistika. Vienas mano pažįstamas, kuris užsiima krovinių pervežimu, naudoja kelio eismo intensyvumo duomenis planuodamas maršrutus ir nustatydamas kainas.
Duomenų formatai: CSV, JSON, XML ir kiti baisūs žodžiai
Gerai, dabar apie tai, kas daugeliui atrodo kaip kažkokia kosmoso kalba – duomenų formatai. Kai pirmą kartą pamačiau, kad duomenys prieinami „CSV, JSON, XML” formatais, pagalvojau: „Puiku, dabar man reikia tapti programuotoju?”
Atsakymas – ne. Bet reikia suprasti pagrindus.
CSV (Comma-Separated Values) – tai paprasčiausias ir jums draugiškiausias formatas. Tai iš esmės Excel lentelė, tik paprastesnė. Galite atsisiųsti CSV failą ir tiesiog atidaryti jį su Excel ar Google Sheets. Dauguma atvirų duomenų portalų siūlo šį formatą, ir būtent nuo jo turėtumėte pradėti.
JSON ir XML – šie formatai labiau skirti programuotojams ir automatizuotoms sistemoms. Jei nesate techniškai pasiruošęs, tiesiog juos ignoruokite pradžioje. Vėliau, jei reikės integruoti duomenis į savo sistemas, galėsite pasamdyti programuotoją, kuris su jais dirbs.
API (Application Programming Interface) – kai kurie portalai siūlo API prieigą. Tai reiškia, kad galite automatiškai gauti naujausius duomenis be rankinio atsisiuntimo. Vėlgi, tai labiau pažangiems vartotojams, bet verta žinoti, kad tokia galimybė egzistuoja.
Mano patarimas: pradėkite nuo CSV failų. Atsisiųskite, atidarykite Excel, pažiūrėkite, kas ten yra. Eksperimentuokite su filtrais, rūšiavimu, paprasta analize. Kai jums to taps per maža, tada galvokite apie sudėtingesnius sprendimus.
Kaip paversti duomenis į realius verslo sprendimus
Čia ir prasideda tikroji magija. Turėti duomenis – tai viena, bet ką su jais daryti? Kaip juos paversti į sprendimus, kurie uždirbs jums pinigų ar sutaupys išlaidų?
Leiskite pasidalinti keliais praktiniais pavyzdžiais iš realaus gyvenimo (vardų neminėsiu, bet situacijos tikros):
Pavyzdys 1: Naujos parduotuvės vietos pasirinkimas. Viena mažmeninės prekybos įmonė norėjo atidaryti naują filialą. Vietoj to, kad samdytų brangią konsultacinę firmą, jie panaudojo atvirus duomenis: gyventojų tankio žemėlapius, vidutinių pajamų statistiką pagal rajonus, konkurentų skaičių (iš verslo registro), transporto prieinamumo duomenis. Sukūrė paprastą balų sistemą kiekvienam potencialiam rajonui ir pasirinko vietą. Po metų – viena sėkmingiausių jų parduotuvių.
Pavyzdys 2: Paslaugų kainų optimizavimas. IT paslaugų įmonė norėjo suprasti, ar jų kainos konkurencingos. Panaudojo verslo registro duomenis apie panašias įmones, jų pajamas ir darbuotojų skaičių. Apskaičiavo vidutines pajamas vienam darbuotojui ir palygino su savo rodikliais. Suprato, kad kainuoja per pigiai ir pakėlė kainas 15%. Klientų praradimų – minimaliai, pelnas išaugo gerokai.
Pavyzdys 3: Rinkos tendencijų numatymas. Nekilnojamojo turto agentas reguliariai stebi būsto sandorių duomenis, kurie skelbiami atvirai. Pastebi tendencijas anksčiau nei konkurentai – kuriuose rajonuose kainos kyla, kur mažėja sandorių skaičius. Tai leidžia jam patariauti klientams geriau ir būti žingsnį priekyje rinkos.
Esmė ta, kad duomenys patys savaime nieko nereiškia. Jūs turite juos interpretuoti, palyginti su savo situacija ir pritaikyti konkretiems sprendimams.
Įrankiai ir metodai, kurie palengvins gyvenimą
Nebūtinai turite būti duomenų mokslininkas, kad efektyviai dirbtumėte su atvirais duomenimis. Yra keletas paprastų įrankių, kurie gali labai palengvinti procesą.
Excel arba Google Sheets – jūsų geriausi draugai pradžioje. Mokėjimas naudoti pagrindines funkcijas (SUMIF, VLOOKUP, pivot lenteles) atvers jums didžiulį potencialą. Yra tūkstančiai nemokamų YouTube pamokų, kaip tai daryti. Aš pats išmokau per savaitgalį, žiūrėdamas vaizdo įrašus.
Power BI arba Google Data Studio – kai norite sukurti gražias vizualizacijas ir interaktyvias ataskaitas. Šie įrankiai turi nemokamas versijas, kurių pakanka pradžiai. Galite importuoti CSV failus ir sukurti profesionaliai atrodančius grafikus bei diagramas.
OpenRefine – nemokama programa duomenų valymui ir transformavimui. Jei atsisiuntėte duomenis ir jie atrodo chaotiški, šis įrankis padės juos sutvarkyti. Šiek tiek sudėtingesnis nei Excel, bet verta išmokti, jei dirbate su dideliais duomenų kiekiais.
QGIS – jei jums reikia dirbti su geografiniais duomenimis (žemėlapiais), tai nemokama ir galinga programa. Pavyzdžiui, galite vizualizuoti, kur yra jūsų klientai, konkurentai, potencialios rinkos.
Svarbu suprasti: nereikia mokėti naudoti visų šių įrankių iš karto. Pradėkite nuo Excel. Kai jums to taps per maža, pereikite prie kito lygio. Aš pats vis dar daugumą dalykų darau Excel, ir tai puikiai veikia.
Dažniausios klaidos ir kaip jų išvengti
Per savo kelionę su atvirais duomenimis esu padaręs nemažai klaidų. Kai kurios buvo juokingos, kai kurios kainavo laiko ir pastangų. Štai ko turėtumėte vengti:
Klaida Nr. 1: Duomenų aktualumas. Kartą priėmiau sprendimą remdamasis duomenimis, kurie buvo trejų metų senumo. Pasaulis per tą laiką pasikeitė, ir mano išvados buvo neteisingos. Visada tikrinkite, kada duomenys buvo atnaujinti paskutinį kartą. Jei tai 2018 metų duomenys, o dabar 2024-ieji – pagalvokite dukart.
Klaida Nr. 2: Konteksto ignoravimas. Skaičiai gali meluoti, jei nežinote konteksto. Pavyzdžiui, jei matote, kad tam tikrame rajone gyventojų skaičius išaugo 20%, tai gali atrodyti puiku. Bet jei nepasidomite, kodėl tai įvyko (gal pastatė socialinį būstą ar pabėgėlių centrą), galite priimti neteisingą sprendimą.
Klaida Nr. 3: Perdėtas pasitikėjimas duomenimis. Duomenys – tai tik vienas informacijos šaltinis. Jie neturėtų būti vienintelis sprendimo pagrindas. Derinkite juos su savo patirtimi, rinkos žinojimu, klientų atsiliepimais. Duomenys parodo „ką”, bet ne visada „kodėl”.
Klaida Nr. 4: Duomenų kokybės nevertinimas. Ne visi atvirų duomenų rinkiniai yra vienodai kokybiški. Kai kuriuose gali būti klaidų, praleistų reikšmių, nenuoseklumų. Prieš remdamiesi duomenimis, bent greitai juos peržiūrėkite – ar atrodo logiški, ar nėra akivaizdžių keistenybių.
Klaida Nr. 5: Analizės paralyžius. Tai mano asmeninė silpnybė. Galima įsitraukti į duomenų analizę taip giliai, kad praleisi savaites tyrinėdamas ir niekada nepriimsi sprendimo. Nustatykite sau terminus – pavyzdžiui, dvi dienas analizei, tada sprendimas. Geriau priimti 80% geras sprendimas greitai nei 100% tobulas sprendimas per vėlai.
Kai duomenys tampa jūsų konkurenciniu pranašumu
Dabar noriu pasidalinti tuo, kaip atvirų duomenų naudojimas gali tapti ne tik naudingu įrankiu, bet tikru konkurenciniu pranašumu. Ypač jei esate mažas ar vidutinis verslas, konkuruojantis su didesniais žaidėjais.
Didžiosios kompanijos turi pinigų brangiai rinkos analizei, konsultantams, specializuotoms duomenų bazėms. Bet žinot ką? Jie dažnai naudoja tuos pačius atvirus duomenis, už kuriuos jūs mokate nulis eurų. Skirtumas tas, kad jie turi komandas, kurios tuo užsiima. Bet jei esate motyvuotas ir pasiruošęs išmokti, galite gauti 70-80% tos pačios vertės be didžiulių investicijų.
Štai kaip tai padaryti:
Sukurkite reguliarią stebėsenos sistemą. Vietoj to, kad žiūrėtumėte duomenis kartą per metus, nustatykite sau rutinų – pavyzdžiui, kiekvieną ketvirtį atsisiųsti naujausius duomenis, kurie svarbūs jūsų verslui. Tai gali būti naujos įmonės registracijos jūsų sektoriuje, demografiniai pokyčiai, ekonominiai rodikliai. Sukurkite Excel failą, kuriame sekate šias tendencijas laikui bėgant.
Derinkite skirtingų šaltinių duomenis. Tikroji galia atsiranda, kai sujungiate duomenis iš kelių šaltinių. Pavyzdžiui, demografinius duomenis su verslo registro informacija ir transporto statistika. Tai leidžia pamatyti ryšius, kurių kiti nemato.
Dalinkitės įžvalgomis su komanda. Jei turite darbuotojų, įtraukite juos į procesą. Galbūt pardavimų vadybininkas pastebės kažką duomenyse, ko jūs nepastebėjote. Galbūt marketingo specialistas turės idėją, kaip panaudoti tam tikrą statistiką kampanijoje.
Naudokite duomenis komunikacijai su klientais. Kai galite paremti savo pasiūlymus ar rekomendacijas konkrečiais duomenimis, tai kelia jūsų profesionalumo įvaizdį. „Mes rekomenduojame šią strategiją, nes pagal naujausius duomenis…” skamba daug įtikinamiau nei „Mes manome, kad…”.
Aš pažįstu vieną konsultantą, kuris specializuojasi padėti mažoms įmonėms plėstis. Jo „slaptasis ginklas” – atvirų duomenų analizė. Jis gali per kelias valandas pateikti klientui išsamią rinkos analizę, konkurentų apžvalgą, demografines tendencijas – viską paremtą oficialiais duomenimis. Klientai mano, kad jis turi prieigą prie brangių duomenų bazių, bet iš tiesų 90% informacijos jis gauna iš atvirų šaltinių. Ir už šią paslaugą jis ima neblogus pinigus.
Kai duomenys tampa įpročiu, o ne projektu
Žinote, kas man labiausiai padėjo su atvirais duomenimis? Kai nustojau į tai žiūrėti kaip į atskirą projektą ar užduotį, o pradėjau kaip į įprotį. Kaip patikrinti el. paštą ar pažiūrėti banko sąskaitą – taip pat reguliariai žvilgteliu į duomenis, kurie svarbūs mano verslui.
Nebandykite tapti duomenų mokslininku per naktį. Pradėkite mažai. Gal kartą per mėnesį skiriate valandą pažiūrėti, kas naujo atsirado jūsų srities duomenyse. Gal kas ketvirtį padarote paprastą analizę, kaip keičiasi jūsų rinkos rodikliai. Laikui bėgant tai taps natūralu, ir pastebėsite, kad jūsų sprendimai tampa pagrįstesni, labiau apgalvoti.
Atvirų duomenų portalai nėra tobuli. Kartais duomenys pasenę, kartais ne visai tai, ko ieškote, kartais formatas nepatogus. Bet tai vis tiek neįtikėtinai vertingas išteklius, ypač mažam ar vidutiniam verslui, kuris neturi didelių biudžetų rinkos tyrimams.
Svarbiausia – pradėti. Nelauk tobulo momento, nelauk, kol išmoksi viską. Tiesiog eik į data.gov.lt (ar bet kurį kitą atvirų duomenų portalą), įvesk raktažodį, susijusį su tavo verslu, ir pažiūrėk, kas ten yra. Atsisiųsk vieną CSV failą. Atidaryk jį Excel. Pažiūrėk, ką ten randi. Gal nieko įdomaus, gal kažką naudingo – bet bent jau pradėjai.
Ir kas žino – gal po pusmečio būtent duomenys, kuriuos radai tame portale, padės priimti sprendimą, kuris pakeis tavo verslo trajektoriją. Man taip nutiko, ir tikiu, kad gali nutikti ir tau.