| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 3 / 3
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
Uporaba vektorske vgradnje za inteligentno obdelavo slovenskega besedila
Urban Strnišnik, 2020, magistrsko delo

Opis: V sklopu magistrske naloge smo se najprej osredotočili v problematiko pridobivanja uporabnega znanja iz nestrukturiranega besedila. Po poročilih IDC je razmerje med strukturiranimi in nestrukturiranimi podatki vsako leto večje. Načinov pridobivanja uporabnega znanja iz nestrukturiranega besedila je več, ena izmed njih so besedne vložitve oz. vektorska vgradnja. Najprej smo se posvetili pregledu tehnik besednih vložitev, kaj to je in kaj z njimi dosežemo. Ugotovili smo, da da izraz besedna vložitev stoji za določitvijo vektorske vrednosti besedi, s katero lahko izvajamo nadaljnje računske operacije. Namen magistrske naloge je bil preizkusiti nekatere algoritme vektorske vgradnje, izdelati lastne modele obdelave besedil in jih nato primerjati z nekaterimi že obstoječimi modeli. Lastne in obstoječe modele obdelave besedil smo nato preizkusili in na podlagi primerjave ugotovili prednosti in slabosti pri uporabi v določenem okolju. V sklopu učenja modelov smo se osredotočili tako v nadzorovane kot tudi v nenadzorovane tehnike učenja. Vhodni korpus podatkov smo pridobili iz pravilnikov štirinajstih slovenskih univerz in fakultet. Iz ugotovljenih rezultatov smo opravili analizo in diskusijo rezultatov, kjer smo dobili odgovore na zastavljena raziskovalna vprašanja, hipoteze pa sprejeli ali zavrnili.
Ključne besede: Besedne vložitve, strojno učenje, fastText, obdelava naravnega jezika, doc2vec, word2vec, klasifikacija besedila, nadzorovano učenje, nenadzorovano učenje
Objavljeno: 17.11.2020; Ogledov: 126; Prenosov: 32
.pdf Celotno besedilo (3,65 MB)

2.
S strojnim učenjem podprto odločanje v medicini
Jan Jurman, 2020, magistrsko delo

Opis: Rast priljubljenosti strojnega učenja se izraža z njegovo uporabo v različnih domenah. V magistrskem delu je predstavljena uporaba algoritmov strojnega učenja za podporo pri odločanju v medicini. Poudarek je na klasifikaciji prisotnosti srčnih bolezni in določanju podvrst kronične ishemične srčne bolezni. Analizirana je natančnost klasifikatorjev naivni Bayes, logistična regresija, k-najbližjih sosedov, odločitveno drevo, nevronska mreža, bagging, AdaBoost in naključni gozd. Implementirana je tudi aplikacija, ki omogoča diagnosticiranje posameznika in inkrementalno izboljšavo svoje natančnosti s pomočjo dodajanja učnih vzorcev.
Ključne besede: strojno učenje, srčna bolezen, klasifikacija, nadzorovano učenje
Objavljeno: 03.07.2020; Ogledov: 203; Prenosov: 73
.pdf Celotno besedilo (1,82 MB)

3.
Razvoj modela za inteligentno podporo odločanju na osnovi analize nesktrukturiranih vsebin
Miha Pavlinek, 2016, doktorska disertacija

Opis: V svetu vseprisotnega računalništva se s kopičenjem naprav ter množično uporabo družbenih omrežij, elektronske komunikacije in drugih oblik IKT storitev naglo povečuje tudi količina nestrukturiranih vsebin. To nas sili k uporabi inteligentnih rešitev, ki za nas te vsebine organizirajo, se namesto nas odločajo o njihovi pomembnosti in nam posredujejo zgolj najbolj relevantne med njimi. Osnovna zmožnost takšnih rešitev je klasifikacija vsebin, zato so v njih avtomatski klasifikatorji nepogrešljiv člen. Zanje je tipično, da za učenje potrebujejo številne označene primerke z ustrezno predstavitvijo, v praksi pa označeni primerki niso vedno na voljo, zato je potrebno avtomatske klasifikatorje prilagoditi tako, da so sposobni pri učenju uporabljati tudi druge, neoznačene vsebine. V disertaciji smo predstavili metodo ST LDA (ang. Self-Training with LDA) za klasifikacijo besedil, ki za učenje klasifikatorja potrebuje le minimalno množico označenih in veliko večjo množico neoznačenih primerkov. Predlagali smo algoritem, ki temelji na metodi samoučenja ter predstavitvi besedil na osnovi tematskega modela, kar prinaša dodatne faktorje, od katerih je odvisna njegova uspešnost. Za vsak faktor smo, na podlagi številnih eksperimentov nad sedmimi besedilnimi podatkovnimi zbirkami, ocenili vpliv na uspešnost klasifikacije ter definirali model za določanje vrednosti parametrov, s čimer se izognemo dodatnim nastavitvam. Uspešnost metode smo primerjali z uspešnostjo drugih uveljavljenih metod in predstavitev, pri čemer predlagana metoda ST LDA dosega nadpovprečne rezultate, kar smo navsezadnje potrdili z neparametričnimi statističnimi testi.
Ključne besede: obdelava naravnega jezika, tekstovno rudarjenje, klasifikacija, tematsko modeliranje, delno nadzorovano učenje, samoučenje
Objavljeno: 16.09.2016; Ogledov: 1173; Prenosov: 142
.pdf Celotno besedilo (4,13 MB)

Iskanje izvedeno v 0.11 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici