1.
SEGMENTACIJA BESEDIL DIPLOMSKIH NALOG IZ DIGITALNE KNJIŽNICE UNIVERZE V MARIBORUMarcel Žerdin, 2011, diplomsko delo/naloga
Opis: Diplomsko delo zajema predstavitev načrtovanja in implementacije programske rešitve za segmentiranje diplomskih del iz Digitalne knjižnice Univerze v Mariboru (DKUM). V delu smo najprej opisali področje procesiranja naravnega jezika in ujemanja vzorcev. Zatem smo opisali programsko rešitev. Predstavili smo postopek pridobitve čistega teksta iz dokumentov PDF, nato analizo zgradbe diplomskih nalog in njihovo segmentiranje. Podali smo tudi opis razvojnega okolja ter opisali težave in omejitve, na katere smo naleteli med razvojem programske rešitve. V zaključku smo podali nekaj sklepnih misli o rezultatih in možnostih nadaljnjega dela.
Ključne besede: segmentiranje besedila, procesiranje naravnega jezika, ujemanje vzorcev, regularni izrazi
Objavljeno v DKUM: 23.09.2011; Ogledov: 2506; Prenosov: 203 (1 glas)
Celotno besedilo (2,29 MB)