| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


1 - 2 / 2
First pagePrevious page1Next pageLast page
1.
S strojnim učenjem podprta analiza znanstvenih revij in avtorjev
Tevž Šart, 2021, master's thesis

Abstract: V sklopu magistrske naloge smo se osredotočili na problematiko iskanja primernih revij za objavo znanstvenih člankov različnih avtorjev. V prvem delu smo se osredotočili na pridobivanje znanja iz nestrukturiranih podatkov. Za pridobivanje uporabnega znanja smo uporabili način besedne vložitve. V drugem delu smo se osredotočili na izgradnjo programske rešitve za vektorizacijo znanstvenih člankov in revij. Namen magistrske je bil ugotoviti, ali lahko s pomočjo strojnega učenja in tehnike vektorizacije besedila ugotovimo podobnosti med znanstvenimi članki različnih avtorjev in revij ter na takšen način ugotovimo, ali avtor objavlja svoje znanstvene članke v pravilnih revijah. Vhodni korpus smo pridobili iz spletne baze znanstvenih člankov Scopus. S pomočjo rezultatov programske rešitve smo opravili analizo, s pomočjo katere smo pridobili odgovore na zastavljena raziskovalna vprašanja ter posledično sprejeli ali zavrgli hipoteze.
Keywords: doc2vec, tf-idf, besedne vložitve, vektorizacija besedila, obdelava naravnega jezika
Published: 20.04.2021; Views: 98; Downloads: 14
.pdf Full text (1,52 MB)

2.
Uporaba vektorske vgradnje za inteligentno obdelavo slovenskega besedila
Urban Strnišnik, 2020, master's thesis

Abstract: V sklopu magistrske naloge smo se najprej osredotočili v problematiko pridobivanja uporabnega znanja iz nestrukturiranega besedila. Po poročilih IDC je razmerje med strukturiranimi in nestrukturiranimi podatki vsako leto večje. Načinov pridobivanja uporabnega znanja iz nestrukturiranega besedila je več, ena izmed njih so besedne vložitve oz. vektorska vgradnja. Najprej smo se posvetili pregledu tehnik besednih vložitev, kaj to je in kaj z njimi dosežemo. Ugotovili smo, da da izraz besedna vložitev stoji za določitvijo vektorske vrednosti besedi, s katero lahko izvajamo nadaljnje računske operacije. Namen magistrske naloge je bil preizkusiti nekatere algoritme vektorske vgradnje, izdelati lastne modele obdelave besedil in jih nato primerjati z nekaterimi že obstoječimi modeli. Lastne in obstoječe modele obdelave besedil smo nato preizkusili in na podlagi primerjave ugotovili prednosti in slabosti pri uporabi v določenem okolju. V sklopu učenja modelov smo se osredotočili tako v nadzorovane kot tudi v nenadzorovane tehnike učenja. Vhodni korpus podatkov smo pridobili iz pravilnikov štirinajstih slovenskih univerz in fakultet. Iz ugotovljenih rezultatov smo opravili analizo in diskusijo rezultatov, kjer smo dobili odgovore na zastavljena raziskovalna vprašanja, hipoteze pa sprejeli ali zavrnili.
Keywords: Besedne vložitve, strojno učenje, fastText, obdelava naravnega jezika, doc2vec, word2vec, klasifikacija besedila, nadzorovano učenje, nenadzorovano učenje
Published: 17.11.2020; Views: 143; Downloads: 33
.pdf Full text (3,65 MB)

Search done in 0.08 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica