Kodėl verta sekti atvirų duomenų portalus (ir kaip tai gali pakeisti jūsų verslą)
Prisipažinsiu – prieš kelerius metus net nežinojau, kad egzistuoja kažkokie atvirų duomenų portalai. Skamba kaip kažkas labai techninio ir skirto tik IT specialistams, tiesa? Bet kai kartą kolega pasidalino, kaip jis naudodamas tokius duomenis rado naują klientų segmentą savo verslui, supratau, kad praleisiu aukso kasyklą.
Atvirų duomenų portalai – tai valstybės ar savivaldybių valdomi puslapiai, kur skelbiami įvairūs viešieji duomenys. Nuo demografinės statistikos iki viešųjų pirkimų, nuo transporto duomenų iki aplinkosaugos rodiklių. Ir visa tai – visiškai nemokamai prieinama. Tik reikia žinoti, kaip tai panaudoti praktiškai.
Daugelis verslų ir net viešojo sektoriaus organizacijų tiesiog nežino, kiek vertingos informacijos guli po nosimi. Kalbėjau su vieno startuolio įkūrėju, kuris pripažino, kad metus mokėjo už rinkos tyrimus, kai dauguma duomenų buvo prieinami nemokamai. Skaudu, bet labai dažna situacija.
Kokių duomenų galima rasti ir kam jie iš tikrųjų naudingi
Pirmą kartą užėjus į atvirų duomenų portalą, galima tiesiog pasimesti. Tūkstančiai duomenų rinkinių, įvairūs formatai, keistos kategorijos. Bet iš tikrųjų viskas gana logiškai suskirstyta, kai tik supranti, ko ieškai.
Verslo perspektyvoje labiausiai vertingi būna šie duomenų tipai:
Viešieji pirkimai – tai tikra aukso gysla. Galite matyti, kas, kada ir už kiek perka valstybė ar savivaldybės. Vienas mano pažįstamas IT paslaugų teikėjas kas savaitę peržiūri naujus pirkimus ir taip surado kelis didelius klientus. Jis paprasčiausiai matė, kokios organizacijos perka panašias paslaugas, ir tiesiogiai kreipėsi pasiūlyti savo sprendimus.
Demografiniai duomenys – kur gyvena jūsų potencialūs klientai, kokio amžiaus, kokie jų pajamų lygiai. Vienas restoranų tinklas naudojo šiuos duomenis spręsdamas, kuriame rajone atidaryti naują filialą. Rezultatas? Pirmą mėnesį viršijo prognozes 40%.
Transporto ir mobilumo duomenys – kur žmonės juda, kokiais maršrutais, kokiu laiku. Tai naudinga ne tik logistikos įmonėms. Viena reklamos agentūra naudojo šiuos duomenis optimizuoti lauko reklamos kampanijas – dėjo skydus ten, kur realiai eina didžiausi žmonių srautai.
Verslo registro duomenys – kas steigė naujas įmones, kokiose srityse, kokia jų finansinė būklė. B2B sektoriui tai neįkainojama informacija. Galite identifikuoti potencialius partnerius ar klientus dar prieš jiems pradedant aktyviai ieškoti tiekėjų.
Viešajam sektoriui šie duomenys ne mažiau svarbūs. Savivaldybė, su kuria bendradarbiavau, naudojo transporto duomenis planuodama viešojo transporto maršrutus. Rezultatas – 15% padidėjęs keleivių skaičius ir sumažėję skundai.
Kaip praktiškai pradėti: nuo pirmo apsilankymo iki realių rezultatų
Gerai, teorija aišku, bet kaip realiai pradėti? Pasidalinsiu savo patikrintu procesu, kuris veikia.
Pirmas žingsnis – aiškiai suformuluokite, ko ieškote. Ne tiesiog „noriu duomenų apie klientus”, o konkrečiai: „noriu žinoti, kiek 25-40 metų žmonių gyvena Vilniaus Šnipiškėse ir koks jų vidutinis pajamų lygis”. Kuo konkretesnis klausimas, tuo lengviau rasti atsakymą.
Antras žingsnis – susipažinkite su portalo struktūra. Lietuvoje pagrindinis toks portalas yra data.gov.lt, bet ir savivaldybės turi savo. Praleiskite 30 minučių tiesiog naršydami kategorijas. Taip, gali atrodyti nuobodu, bet tai investicija, kuri atsipirks.
Trečias žingsnis – išmokite naudoti paieškos filtrus. Dauguma portalų leidžia filtruoti pagal datą, kategoriją, formatą. Pavyzdžiui, jei jums reikia duomenų, kuriuos galėtumėte importuoti į Excel, ieškokite CSV ar XLSX formatų.
Ketvirtas žingsnis – pradėkite nuo paprastų duomenų rinkinių. Nepuolę iš karto į sudėtingas statistines lenteles. Pasirinkite kažką paprasto, atsisiųskite, pažiūrėkite, kaip atrodo. Pavyzdžiui, savivaldybės biudžeto duomenys paprastai būna gana aiškūs ir lengvai suprantami.
Vienas svarbus patarimas iš patirties: užsirašykite, ko ieškojote ir kur radote. Aš turiu paprastą Excel lentelę, kur fiksuoju, kokius duomenis naudoju, iš kur juos gavau ir kada paskutinį kartą atnaujinau. Gali atrodyti perdėm kruopštu, bet kai po pusmečio vėl reikės tų pačių duomenų, padėkosi sau.
Realūs pavyzdžiai: kaip verslai ir organizacijos naudoja atvirus duomenis
Teorija be praktikos – kaip automobilis be ratų. Pasidalinsiu keliais realiais atvejais, kuriuos mačiau ar pats dalyvavau.
Atvejis 1: Mažmeninės prekybos tinklas
Vienas prekybos tinklas norėjo plėstis į regionus, bet nežinojo, kur tiksliai. Vietoj brangių rinkos tyrimų, jie panaudojo atvirų duomenų portaluose esančią informaciją:
– Demografinius duomenis apie gyventojų pasiskirstymą
– Vidutines pajamas pagal savivaldybes
– Konkurentų lokacijas (iš verslo registro)
– Transporto infrastruktūros duomenis
Rezultatas? Jie identifikavo tris miestus, kurie atitiko jų kriterijus, bet kur konkurencija buvo minimali. Per metus atidarė tris naujas parduotuves, ir visos trys buvo pelningos nuo trečio mėnesio.
Atvejis 2: Startuolis aplinkosaugos srityje
Vienas startuolis kūrė aplikaciją oro kokybės stebėjimui. Vietoj to, kad patys statytų brangius jutiklius, jie panaudojo atvirai skelbiamus aplinkosaugos duomenis. Pridėjo savo analitikos sluoksnį, vartotojui draugišką sąsają ir turėjo veikiantį produktą per kelis mėnesius.
Įdomiausia, kad vėliau jie šiuos duomenis papildė savo surinkta informacija ir dabar patys prisideda prie atvirų duomenų ekosistemos. Tokia graži cikliška istorija.
Atvejis 3: Savivaldybės sprendimas dėl vaikų darželių
Viena savivaldybė naudojo demografinius duomenis ir gimstamumo statistiką planuodama naujų darželių statybas. Vietoj to, kad statytų ten, kur yra laisva žemė, jie analizavo, kur bus didžiausias poreikis po 3-5 metų.
Rezultatas? Išvengė situacijos, kai vienur darželiai perpildyti, o kitur – pustuščiai. Sutaupė biudžeto lėšų ir padidino gyventojų pasitenkinimą.
Duomenų analizė be IT specialisto: įrankiai ir metodai
Dabar galbūt galvojate: „Gerai, bet aš ne duomenų analitikas, kaip man visa tai apdoroti?” Geros naujienos – nebūtinai reikia būti techniniu genijumi.
Excel ar Google Sheets – tai jūsų geriausi draugai. 90% atvirų duomenų galima prasimingai analizuoti tiesiog naudojant šias programas. Mokate daryti pivot lenteles? Puiku, to pakanka daugumai užduočių.
Vienas paprastas pavyzdys: atsisiuntėte viešųjų pirkimų duomenis CSV formatu. Atidarote Excel, padarote lentelę, pritaikote filtrus ir galite matyti, kas perka jūsų srities paslaugas. Nereikia jokio programavimo.
Power BI ar Tableau Public – jei norite gražių vizualizacijų, šie įrankiai turi nemokamas versijas. Taip, reikės šiek tiek laiko išmokti, bet YouTube pilnas mokomųjų vaizdo įrašų. Per savaitgalį galite išmokti pagrindų.
Aš pats nesu IT specialistas, bet išmokau naudoti Power BI per maždaug mėnesį, skirdamas po valandą per dieną. Dabar galiu sukurti interaktyvias ataskaitas, kurios atrodo profesionaliai ir padeda priimti sprendimus.
Python ir R – jei esate ambicingesni, šios programavimo kalbos leidžia daryti sudėtingesnę analitiką. Bet būkime sąžiningi, daugumai verslų to nereikia. Pradėkite nuo paprastesnių įrankių.
Vienas svarbus patarimas: nebijokite eksperimentuoti. Atsisiųskite duomenų rinkinį ir tiesiog žaiskite su juo. Darykite įvairius filtrus, skaičiuokite vidurkius, kurkite grafikus. Blogiausia, kas gali nutikti – sugaisite valandą laiko. Geriausia – atrasit kažką vertingo.
Dažniausios klaidos ir kaip jų išvengti
Per metus darbo su atvirais duomenimis mačiau (ir pats padariau) nemažai klaidų. Pasidalinsiu dažniausiomis, kad jūs jų išvengtumėte.
Klaida #1: Pasitikėti duomenimis aklai
Atvirų duomenų kokybė ne visada ideali. Kartais būna pasenusių duomenų, kartais – klaidų. Visuomet patikrinkite, kada duomenys paskutinį kartą atnaujinti ir ar jie atrodo logiški.
Turėjau atvejį, kai vienas klientas priėmė sprendimą remdamasis trejų metų senumo duomenimis. Rezultatas buvo, švelniai tariant, ne toks, kokio tikėjosi. Dabar visada pirmiausia žiūrime į duomenų aktualumo datą.
Klaida #2: Analizuoti per daug duomenų vienu metu
Kai tik atrandi atvirų duomenų portalą, nori atsisiųsti viską. Bet tai kelias į pralaimėjimą. Geriau sutelkti dėmesį į kelis konkrečius duomenų rinkinius, kurie tikrai aktualūs jūsų tikslams.
Pradėkite nuo vieno-dviejų duomenų rinkinių. Išmokite juos gerai analizuoti. Tada plėskite. Tai kaip sportuoti – geriau reguliariai po truputį nei kartą per mėnesį iki išsekimo.
Klaida #3: Neatsižvelgti į kontekstą
Skaičiai patys savaime nieko nereiškia. Pavyzdžiui, jei matote, kad vienoje savivaldybėje vidutinės pajamos 20% didesnės nei kitoje, tai dar nereiškia, kad ten geriau pardavinėsite savo produktą. Galbūt ten ir pragyvenimo kaštai atitinkamai didesni.
Visuomet bandykite suprasti platesnį kontekstą. Kalbėkite su žmonėmis, kurie dirba toje srityje, skaitykite susijusius tyrimus, naudokite savo patirtį.
Klaida #4: Neautomatizuoti pasikartojančių procesų
Jei kas mėnesį atsisiunčiate tuos pačius duomenis ir darote tą pačią analizę – automatizuokite. Excel makrokomandos, Power Query ar paprasčiausi skriptai gali sutaupyti daugybę laiko.
Aš pats ilgai rankinio darbo būdu dariau mėnesines ataskaitas, kol kolega parodė, kaip tai automatizuoti. Dabar procesas, kuris užimdavo 3 valandas, užima 15 minučių. Ir daugiau laiko lieka tikrai vertingiems dalykams – analizei ir sprendimų priėmimui.
Kaip integruoti atvirus duomenis į kasdienę veiklą
Vienas dalykas – kartą pasinaudoti atvirais duomenimis projektui. Visai kitas – padaryti tai nuolatine praktika. Ir būtent čia slypi tikroji vertė.
Pirmiausia, nustatykite reguliarius duomenų peržiūros laikotarpius. Pavyzdžiui, kiekvieną pirmadienį rytą praleiskite 30 minučių peržiūrėdami naujus duomenų rinkinius ar atnaujinimus. Tai kaip skaityti naujienas, tik daug vertingiau verslui.
Antra, sukurkite duomenų naudojimo procesą. Kas jūsų organizacijoje turėtų žiūrėti kokius duomenis? Kaip ši informacija turėtų būti dalijamasi? Kas priima sprendimus remiantis šiais duomenimis?
Viename versle, su kuriuo dirbau, sukūrėme paprastą sistemą: rinkodaros vadovas kas savaitę peržiūri demografinius ir vartotojų elgsenos duomenis, pardavimų vadovas – viešųjų pirkimų ir konkurentų duomenis, o vadovybė gauna suvestinę kas mėnesį. Paprasta, bet veikia.
Trečia, mokykite savo komandą. Nebūkite vienintelis, kuris moka naudoti atvirus duomenis. Organizuokite vidinius mokymus, dalinkitės įžvalgomis, skatinkite eksperimentuoti.
Ketvirta, dokumentuokite savo procesus. Kai rasite naudingą duomenų šaltinį ar analizės metodą, užsirašykite. Sukurkite vidinę wiki ar bent paprastą dokumentą su nuorodomis ir instrukcijomis. Ateityje tai sutaupys begalę laiko.
Ateities perspektyvos ir ko tikėtis
Atvirų duomenų judėjimas tik stiprėja. Lietuvoje, kaip ir visoje ES, vis daugiau duomenų tampa viešai prieinamų. Tai reiškia, kad galimybės tik didės.
Matau kelis aiškius trendus. Pirma, duomenų kokybė gerėja. Institucijos supranta, kad vien išdėlioti duomenis nepakanka – jie turi būti struktūruoti, aktualūs ir lengvai naudojami. Antra, atsiranda daugiau įrankių, leidžiančių paprasčiau dirbti su duomenimis. Nebereikia būti programuotoju, kad išgautum vertę.
Trečia, vis daugiau organizacijų suvokia atvirų duomenų vertę. Tai reiškia, kad konkurencinis pranašumas, kurį šiandien galite gauti naudodami šiuos duomenis, ateityje gali tapti būtinybe. Geriau pradėti dabar, kol dar ne visi tai daro.
Vienas įdomus dalykas, kurį pastebėjau – organizacijos, kurios aktyviai naudoja atvirus duomenis, dažnai tampa inovatyvesnės ir kitose srityse. Lyg duomenimis grįstas mąstymas tampa organizacijos kultūros dalimi. Tai gražus šalutinis efektas.
Kai duomenys tampa jūsų konkurenciniu pranašumu
Grįžkime prie esmės. Atvirų duomenų portalai nėra kažkoks techninis dalykas, skirtas tik specialistams. Tai praktinis įrankis, kuris gali realiai pakeisti, kaip priimate sprendimus versle ar viešajame sektoriuje.
Ar reikia laiko išmokti juos naudoti? Taip. Ar bus iššūkių? Tikrai. Bet ar verta? Be jokios abejonės.
Pradėkite mažai. Pasirinkite vieną konkrečią problemą ar klausimą, kurį norite išspręsti. Raskite atitinkamus duomenis. Paeksperimentuokite. Padarykite išvadas. Pritaikykite praktikoje. Ir tada kartokite procesą.
Nebijokite klysti. Mano pirmosios kelios analizės buvo gana paviršutiniškos ir ne itin naudingos. Bet su kiekviena kita gerėjau. Dabar duomenimis grįstas sprendimų priėmimas tapo natūralia mano darbo dalimi.
Ir paskutinis dalykas – dalinkitės savo patirtimi. Jei radote naudingą duomenų šaltinį ar metodą, papasakokite kolegoms, parašykite straipsnį, pasidalinkite socialiniuose tinkluose. Atvirų duomenų bendruomenė stiprėja, kai visi prisideda. Galbūt jūsų patirtis padės kam nors kitiems, o jų – jums.
Taigi, ko laukiate? Atidarykite data.gov.lt ar savo savivaldybės atvirų duomenų portalą ir pradėkite tyrinėti. Kas žino, galbūt būtent šiandien rasite tą informaciją, kuri pakeis jūsų verslo ar organizacijos ateitį.