Avtomatizacija kategoriziranja obstoječih učinkov uporabe odprtih podatkov glede na opise primerov uporabe
DOI:
https://doi.org/10.31449/upinf.237Ključne besede:
odprti podatki, podatki javnega sektorja, umetna inteligenca, nevronske mrežePovzetek
Odprti podatki (OP) predstavljajo pomemben vir javno dostopnih podatkov, ki izhajajo iz javnega sektorja. Osrednji cilj OP je omogočanje transparentnosti, odgovornosti in ustvarjanje dodane vrednosti. Z naraščanjem količine podatkov, ki jih ustvarja javni sektor, se intenzivno prizadeva za zagotavljanje njihove dostopnosti javnosti. Raziskave kažejo, da so OP dostopni javnosti in tudi uporabljeni na področju ekonomije, kjer podjetja uporabljajo poslovno inteligenco v kompleksnem globalnem gospodarstvu. Vendar pa ekonomske koristi predstavljajo le en vidik učinka OP. Prepoznavanje in kvantificiranje učinka OP je oteženo zaradi njegove posredne narave. Študije, ki prepoznavajo učinek OP, obsegajo predhodne ocene iz anket, ki so omejene s strani osebja in financiranja za dejavnosti, povezane z OP. Izziv torej leži v prepoznavanju učinkov OP, za kar v literaturi zasledimo predloge uporabe tehnik podatkovnega rudarjenja in umetne inteligence. Namen te raziskave je potrditi že prepoznana področja učinkov OP s strani Evropske komisije in usmeriti nadaljnje raziskave s predlogom novih področij učinkov. V raziskavi smo se ravnali po metodi CRISP-DM, uporabili pa smo različne modele strojnega učenja za klasifikacijo primerov uporabe OP. Rezultati kažejo na potencial umetne inteligence pri prepoznavanju učinkov OP, a je potrebno izdelati končno in podrobnejšo taksonomijo prepoznanih področij učinka. Raziskava je prepoznala nove kategorije uporabe OP, ki bi lahko prispevale k bolj natančni in uporabni klasifikaciji učinkov uporabe OP.