Pristopi k denormalizaciji besedil: pregled področja
DOI:
https://doi.org/10.31449/upinf.249Ključne besede:
denormalizacija besedila, inverzna normalizacija besedila, pregled področja, samodejna razpoznava govoraPovzetek
Sodobni sistemi za samodejno razpoznavo govora učinkovito pretvorijo govorjeni jezik v pisno obliko, vendar pogosto ustvarijo zgolj surov prepis brez ustrezno oblikovanih števil, datumov in časovnih izrazov, kar zmanjšuje njegovo berljivost in uporabnost. Denormalizacija je postopek, ki odpravlja te pomanjkljivosti tako, da preoblikuje prepis v standardizirano pisno obliko. Članek podaja sistematičen pregled in analizo glavnih pristopov k denormalizaciji, ki jih je mogoče razvrstiti v tri skupine: pristopi, ki temeljijo na pravilih, nevronski pristopi ter hibridni pristopi. Pristopi, ki temeljijo na pravilih, tipično izhajajo iz končnih avtomatov, nevronski pristopi uporabljajo nevronske mreže, hibridni pristopi pa združujejo elemente obeh pristopov. Pristopi, ki temeljijo na pravilih, dosežejo visoko natančnost, a ne upoštevajo konteksta besedila. Nasprotno nevronski pristopi upoštevajo kontekst besedila, vendar pa zahtevajo obsežne količine podatkov za učenje. Hibridni pristopi predstavljajo kompromisno rešitev, ki združuje prednosti obeh pristopov. Delo prispeva k razumevanju izzivov ter izboljšanju učinkovitosti denormalizacijskih sistemov.Prenosi
Objavljeno
17.06.2025
Kako citirati
[1]
Vezočnik, M. in Bajec, M. 2025. Pristopi k denormalizaciji besedil: pregled področja. Uporabna informatika. 33, 1 (jun. 2025). DOI:https://doi.org/10.31449/upinf.249.
Številka
Rubrike
Pregledni znanstveni prispevki