Pristopi k denormalizaciji besedil: pregled področja

Avtorji

  • Melanija Vezočnik Univerza v Ljubljani, Fakulteta za računalništvo in informatiko
  • Marko Bajec Univerza v Ljubljani, Fakulteta za računalništvo in informatiko

DOI:

https://doi.org/10.31449/upinf.249

Ključne besede:

denormalizacija besedila, inverzna normalizacija besedila, pregled področja, samodejna razpoznava govora

Povzetek

Sodobni sistemi za samodejno razpoznavo govora učinkovito pretvorijo govorjeni jezik v pisno obliko, vendar pogosto ustvarijo zgolj surov prepis brez ustrezno oblikovanih števil, datumov in časovnih izrazov, kar zmanjšuje njegovo berljivost in uporabnost. Denormalizacija je postopek, ki odpravlja te pomanjkljivosti tako, da preoblikuje prepis v standardizirano pisno obliko. Članek podaja sistematičen pregled in analizo glavnih pristopov k denormalizaciji, ki jih je mogoče razvrstiti v tri skupine: pristopi, ki temeljijo na pravilih, nevronski pristopi ter hibridni pristopi. Pristopi, ki temeljijo na pravilih, tipično izhajajo iz končnih avtomatov, nevronski pristopi uporabljajo nevronske mreže, hibridni pristopi pa združujejo elemente obeh pristopov. Pristopi, ki temeljijo na pravilih, dosežejo visoko natančnost, a ne upoštevajo konteksta besedila. Nasprotno nevronski pristopi upoštevajo kontekst besedila, vendar pa zahtevajo obsežne količine podatkov za učenje. Hibridni pristopi predstavljajo kompromisno rešitev, ki združuje prednosti obeh pristopov. Delo prispeva k razumevanju izzivov ter izboljšanju učinkovitosti denormalizacijskih sistemov.

Biografije avtorja

Melanija Vezočnik, Univerza v Ljubljani, Fakulteta za računalništvo in informatiko

Melanija Vezočnik je asistentka v Laboratoriju za podatkovne tehnologije na Fakulteti za računalništvo in informatiko Univerze v Ljubljani. Njeno trenutno raziskovalno delo je usmerjeno v področje govornih in jezikovnih tehnologij. Leta 2023 je na isti fakulteti doktorirala iz računalništva in informatike. Med doktorskim študijem se je raziskovalno ukvarjala z analizo hoje z inercijskimi senzorji, še posebej z oceno dolžine koraka. Rezultate svojega raziskovalnega dela redno objavlja v znanstvenih revijah, za raziskovalne dosežke med doktorskih študijem pa je prejela priznanje dekanje.

Marko Bajec, Univerza v Ljubljani, Fakulteta za računalništvo in informatiko

Marko Bajec je redni profesor na Fakulteti za računalništvo in informatiko (Univerza v Ljubljani) in vodja Laboratorija za podatkovne tehnologije. Ukvarja se z načrtovanjem in razvojem podatkovno intenzivnih sistemov. V zadnjih letih se posveča jezikovnim in govornim tehnologijam ter digitalizaciji slovenskega jezika. Svoje rezultate redno objavlja v domačih in tujih revijah ter konferencah. Je prejemnik več nagrad in priznanj za raziskovalno, pedagoško in aplikativno delo.

Prenosi

Objavljeno

17.06.2025

Kako citirati

[1]
Vezočnik, M. in Bajec, M. 2025. Pristopi k denormalizaciji besedil: pregled področja. Uporabna informatika. 33, 1 (jun. 2025). DOI:https://doi.org/10.31449/upinf.249.

Številka

Rubrike

Pregledni znanstveni prispevki