1.
Uporaba nevronskih jezikovnih modelov za prepoznavanje imenskih entitet iz nestrukturiranih dokumentov : diplomsko deloUrban Knupleš, 2021, diplomsko delo
Opis: Nestrukturirani dokumenti zajemajo informacije v oblikah in postavitvah, ki se lahko od enega primerka do drugega razlikujejo, kar lahko oteži in podraži nalogo pridobivanja informacij. Kot rešitev se je v zadnjih letih za razumevanje dokumentov na področju dokumentne inteligence pričela uporaba nevronskih jezikovnih modelov, usposobljenih na učnih množicah dokumentov. V diplomskem delu za pridobivanje informacij iz skeniranih trgovinskih računov uporabljamo prehodno učeni nevronski jezikovni model, zgrajen iz transformatorjev. Model je natančno učen z uporabo učne množice SROIE za izluščitev štirih kategorij, tj. imen in naslovov trgovin, datumov in skupnih cen. Za pridobivanje informacij smo uporabili prepoznavo imenskih entitet. Za primerjavo izvajamo poskuse s spreminjanem hiperparametrov modela. S spremembo nevronskega jezikovnega modela smo pri poskusih dosegli največjo
natančnost klasifikacije: 96,7 %.
Ključne besede: Dokumentna inteligenca, obdelava naravnih jezikov, prepoznava imenskih entitet, jezikovni modeli, transformatorji
Objavljeno v DKUM: 18.10.2021; Ogledov: 953; Prenosov: 46
Celotno besedilo (1,56 MB)