1.
Uporaba nevronskih jezikovnih modelov za prepoznavanje imenskih entitet iz nestrukturiranih dokumentov : diplomsko deloUrban Knupleš, 2021, undergraduate thesis
Abstract: Nestrukturirani dokumenti zajemajo informacije v oblikah in postavitvah, ki se lahko od enega primerka do drugega razlikujejo, kar lahko oteži in podraži nalogo pridobivanja informacij. Kot rešitev se je v zadnjih letih za razumevanje dokumentov na področju dokumentne inteligence pričela uporaba nevronskih jezikovnih modelov, usposobljenih na učnih množicah dokumentov. V diplomskem delu za pridobivanje informacij iz skeniranih trgovinskih računov uporabljamo prehodno učeni nevronski jezikovni model, zgrajen iz transformatorjev. Model je natančno učen z uporabo učne množice SROIE za izluščitev štirih kategorij, tj. imen in naslovov trgovin, datumov in skupnih cen. Za pridobivanje informacij smo uporabili prepoznavo imenskih entitet. Za primerjavo izvajamo poskuse s spreminjanem hiperparametrov modela. S spremembo nevronskega jezikovnega modela smo pri poskusih dosegli največjo
natančnost klasifikacije: 96,7 %.
Keywords: Dokumentna inteligenca, obdelava naravnih jezikov, prepoznava imenskih entitet, jezikovni modeli, transformatorji
Published in DKUM: 18.10.2021; Views: 953; Downloads: 46
Full text (1,56 MB)