| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 2 / 2
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
Uporaba vektorske vgradnje za inteligentno obdelavo slovenskega besedila
Urban Strnišnik, 2020, magistrsko delo

Opis: V sklopu magistrske naloge smo se najprej osredotočili v problematiko pridobivanja uporabnega znanja iz nestrukturiranega besedila. Po poročilih IDC je razmerje med strukturiranimi in nestrukturiranimi podatki vsako leto večje. Načinov pridobivanja uporabnega znanja iz nestrukturiranega besedila je več, ena izmed njih so besedne vložitve oz. vektorska vgradnja. Najprej smo se posvetili pregledu tehnik besednih vložitev, kaj to je in kaj z njimi dosežemo. Ugotovili smo, da da izraz besedna vložitev stoji za določitvijo vektorske vrednosti besedi, s katero lahko izvajamo nadaljnje računske operacije. Namen magistrske naloge je bil preizkusiti nekatere algoritme vektorske vgradnje, izdelati lastne modele obdelave besedil in jih nato primerjati z nekaterimi že obstoječimi modeli. Lastne in obstoječe modele obdelave besedil smo nato preizkusili in na podlagi primerjave ugotovili prednosti in slabosti pri uporabi v določenem okolju. V sklopu učenja modelov smo se osredotočili tako v nadzorovane kot tudi v nenadzorovane tehnike učenja. Vhodni korpus podatkov smo pridobili iz pravilnikov štirinajstih slovenskih univerz in fakultet. Iz ugotovljenih rezultatov smo opravili analizo in diskusijo rezultatov, kjer smo dobili odgovore na zastavljena raziskovalna vprašanja, hipoteze pa sprejeli ali zavrnili.
Ključne besede: Besedne vložitve, strojno učenje, fastText, obdelava naravnega jezika, doc2vec, word2vec, klasifikacija besedila, nadzorovano učenje, nenadzorovano učenje
Objavljeno: 17.11.2020; Ogledov: 122; Prenosov: 32
.pdf Celotno besedilo (3,65 MB)

2.
Konstrukcija in analiza zelo velikih grafov ključnih besed
Tim Kos, 2015, magistrsko delo

Opis: V magistrskem delu se lotevamo problema konstrukcije grafa ključnih besed iz velikega korpusa besedil. V grafu ključne besede predstavljajo vozlišča, ki so povezana s temami. Dve ključni besedi sta v grafu povezani z neko temo, v kolikor sta v nekem besedilu medsebojno odvisni in to besedilo pripada izbrani temi. V prvem delu so ob konstrukciji takšnega grafa predstavljene še metode za izluščitev ključnih besed in določitev tem besedila. Predstavljeno znanje nato uporabimo na konkretnem primeru. Nad celotno angleško Wikipedijo skonstruiramo graf in ga tudi analiziramo. Predstavimo splošne lastnosti grafa in argumentiramo dobljene rezultate pri analizi grafa. V zadnjem delu navedemo še nekaj primerov uporabe definirane strukture in predstavimo podatkovne baze, ki so za shranjevanje grafa primerne. Končna ugotovitev kaže na to, da graf ključnih besed ni uporaben le za iskanje po besedilih, ampak tudi za vse sorodne probleme, kot so: klasifikacija novega besedila in predlaganje podobnih besedil.
Ključne besede: graf ključnih besed, iskalnik po besedilih, ključne besede, klasifikacija besedila, analiza grafa
Objavljeno: 13.10.2015; Ogledov: 706; Prenosov: 75
.pdf Celotno besedilo (500,25 KB)

Iskanje izvedeno v 0.08 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici