1. Metoda za napoved zmogljivosti stohastičnih algoritmov na osnovi statističnih porazdelitev števila ovrednotenj in časa : doktorska disertacijaJana Herzog, 2024, doctoral dissertation Abstract: V doktorski disertaciji predstavimo metodo, namenjeno analizi in primerjavi stohastičnih algoritmov. Predlagana metoda se imenuje AS^3D (angl.~Analysis of the Stochastic Solvers based on Statistical Distributions). Ta temelji na statističnih porazdelitvah opazovanih spremenljivk, natančneje številu funkcijskih ovrednotenj in času. Pri tem uporablja pristop s ciljno vrednostjo. Ciljno vrednost določa kakovost rešitve, katero želimo, da jo algoritem doseže. Opazovani spremenljivki in njuni statistični porazdelitvi analizira na nizkodimenzionalnih in napoveduje za visokodimenzionalne različice optimizacijskega problema. Vzpostavljeni napovedni model na podlagi parametrov statističnih porazdelitev omogoča napovedovanje zaustavitvenih pogojev, torej časa in števila funkcijskih ovrednotenj za določeno verjetnost doseganja ciljne vrednost. Prav tako omogoča oceno verjetnosti, da bo zagon uspešen glede na dani zaustavitveni pogoj in kakovosti rešitve za višjedimenzionalne različice problema. Da pokažemo uporabnost predlagane metode, smo vzpostavljene napovedne modele empirično validirali za izbrane optimizacijske algoritme in probleme. Razlike med napovedanimi in empiričnimi vrednostmi so znašale manj kot 15 \% za problem LABS, testne funkcije CEC in problem potenciala Lennard-Jones. To nakazuje na to, da lahko metodo AS^3D uspešno uporabljamo za analizo in primerjavo stohastičnih algoritmov na različnih optimizacijskih problemih. S pomočjo metode smo pokazali tudi uporabnost stohastičnih algoritmov. Ti morajo, da dosežejo optimalno rešitev z visoko verjetnostjo, preiskati le majhen delež iskalnega prostora. Keywords: analiza stohastičnih algoritmov, statistična porazdelitev, napovedni model, pristop s ciljno vrednostjo Published in DKUM: 08.04.2025; Views: 0; Downloads: 22
Full text (3,56 MB) |
2. Napovedni model gibanja tržnih cen s pomočjo analize sentimenta : magistrsko deloDavid Pintarič, 2022, master's thesis Abstract: Na svetu obstajajo številni trgi, kjer lahko kupci in prodajalci trgujejo s finančnimi inštrumenti. Ker se cene na trgih neprestano spreminjajo, lahko to lastnost, ki jo imenujemo nestanovitnost, izkoristimo in, če imamo pravilno napoved, ustvarimo profit. V sklopu magistrskega dela se problema pravilne napovedi lotimo z uporabo analize sentimenta in jezikovnih tehnologij. S pomočjo objav uporabnikov na socialnem omrežju Twitter izdelamo model, ki napove gibanje tržne cene kriptovalute Bitcoin. Preizkusimo več različnih algoritmov za klasifikacijo sentimenta. Najboljše rezultate dosežemo z metodo podpornih vektorjev. Ugotovimo, da sta izdelan model in analiza sentimenta uporabna za napoved tržne cene, vendar sama po sebi nista dovolj natančna, da bi ju lahko uporabili kot edini kazalnik. Oba sta bolj primerna kot del večjega sistema za podporo pri odločanju. Keywords: procesiranje naravnega jezika, analiza sentimenta, trgovanje, napovedni model Published in DKUM: 25.10.2022; Views: 600; Downloads: 99
Full text (5,53 MB) |
3. Napovedovanje sprememb kognitivnih sposobnosti pri starejši populacijiAnja Štante, 2021, master's thesis Abstract: Uvod: Delež starejših od 65 let se v populaciji veča. Napovedi kažejo, da se bo do leta 2100 še povečal. Ena od problematik, ki se pojavlja pri starejših, je upad kognitivnih sposobnosti.
Metode: Analizirali smo podatke iz raziskave The Survey of Health, Aging and Retirement in Europe pri valu 6 in 7. Oblikovali smo dve skupini podatkov. V prvo smo uvrstili vse razpoložljive podatke iz držav Evropske unije, v drugo podatke zbrane v Republiki Sloveniji. Analizo podatkov smo izvedli v programskem jeziku R. Z uporabo napovednih modelov smo poskušali napovedati spremembe v vrednosti spremenljivke »razlika v takojšnjem priklicu besed med valoma 6 in 7«. Uporabili smo tri napovedne modele, in sicer multiplo logistično regresijo, Random Forest in Gradient Boosting Machine. Pri dobljenih rezultatih smo primerjali vrednost površine pod krivuljo.
Rezultati: Pri evropski populaciji se je kot najboljši napovedni model izkazala multipla logistična regresija z rezultatom pri vrednosti AUC 0,698 (95% IZ: 0,678-0,705). Pri slovenski populaciji se je kot najboljši izkazal Gradient Boosting Machine z rezultati pri AUC 0,698 (95% IZ: 0,663-0,760).
Razprava in sklep: Izkazalo se je, da na izhodno spremenljivko vplivajo spremenljivke, ki so že zaznane v drugih študijah. Te so priklic besed pri valu 6, starost in stopnja izobrazbe. Pri evropski populaciji je opazen vpliv spremenljivke samoocena računalniških sposobnosti. Študije s področja kognitivnih sposobnosti pri starejših na območju Republike Slovenije so pomembne, saj se slovenska družba stara. Keywords: staranje, kognitivni upad, priklic besed, SHARE, napovedni model Published in DKUM: 29.06.2021; Views: 1216; Downloads: 157
Full text (670,62 KB) |
4. Avtomatizirano trgovanje z uporabo pametnega predikcijskega modela : magistrsko deloLuka Štrakl, 2021, master's thesis Abstract: V magistrskem delu je opisano področje avtomatiziranega trgovanja z algoritmičnim pristopom, ki temelji na odločitvah napovednih modelov, katerih znanje je pridobljeno s pomočjo strojnega učenja. Opisane je delo z podatki, metode strojnega učenja in izdelava napovednih modelov v programskem jeziku Python. Poudarek je na pridobivanju, manipulaciji in uporabi vhodnih podatkov, ter optimizaciji napovednega modela za dosego boljših odločitev na še ne videnih podatkih. V sklopu magistrske naloge smo izdelali programsko opremo algoritmične narave, ki uporablja sožitje pogojev, ki jih trgovalni instrument mora zadovoljiti, ter odločitve dveh napovednih modelov za odpiranje ali zapiranje trgovalnih pozicij. Keywords: Trgovanje, Forex, delnice, strojno učenje, napovedni model Published in DKUM: 13.05.2021; Views: 1401; Downloads: 126
Full text (3,75 MB) |
5. Napovedovanje tveganja za ponovno hospitalizacijo pacientov s sladkorno boleznijo na osnovi podatkov o bolnišničnih obravnavahNives Zeme, 2018, master's thesis Abstract: Izhodišča: Sladkorna bolezen sodi med kronične bolezni, ki zaradi svoje velike pogostosti ter zahtevne in kompleksne obravnave predstavljajo velik javno-zdravstveni problem. Ponovni bolnišnični sprejemi odražajo pomanjkljivosti v zdravstvenem sistemu. S pomočjo metod strojnega učenja in podatkov javnega značaja lahko določimo indikatorje, ki statistično značilno vplivajo na ponovno hospitalizacijo. Na podlagi določenih indikatorjev izdelamo napovedne modele za identifikacijo bolnikov, ki so ogroženi za ponovno hospitalizacijo.
Raziskovalne metode: V magistrskem delu smo za teoretična izhodišča uporabili deskriptivno metodo zbiranja podatkov. Raziskava v empiričnem delu je temeljila na deskriptivni inferenčni statistični metodi. S statističnim programskim orodjem IBM SPSS 22.0 smo zgradili napovedni model za tveganje ponovne hospitalizacije bolnikov s sladkorno boleznijo. Posamezne spremenljivke smo preverili in statistično analizirali s pomočjo testa hi-kvadrat in neparametričnega testa Mann-Whitney U.
Rezultati: Ugotovili smo, da nekateri indikatorji vplivajo na tveganje za ponovno hospitalizacijo v 30 dneh po odpustu iz bolnišnice. Za statistično značilne indikatorje so se izkazali: starost bolnika 74 let [95-odstotni IZ 74,75]; p < 0,001, ležalna doba 7 dni [95-odstotni IZ 7,8]; p < 0,001, število diagnoz 6 [95-odstotni IZ 6,6]; p = 0,047, število procedur 5 [95-odstotni IZ 5,6]; p < 0,000 in mesec odpusta iz bolnišnice 5 [95-odstotni IZ 5,5]; p = 0,001. Pri napovedovanju ponovne hospitalizacije bolnikov v slovenskih in kalifornijskih bolnišnicah obstajajo enaki indikatorji, vendar se med seboj statistično značilno razlikujejo.
Diskusija in zaključek: Napovedovanje tveganja za ponovno hospitalizacijo vključuje dobro poznavanje lastnosti bolnika. Te so: zdravstveno stanje, socialno-demografski dejavniki in uporaba zdravstvenih storitev. Pomembna je opredelitev in razumevanje indikatorjev (spremenljivk) ter njihovih vrednosti, ki vplivajo na ponovno hospitalizacijo bolnikov s sladkorno boleznijo. Keywords: sladkorna bolezen, ponovna hospitalizacija, podatki o bolnišničnih obravnavah, napovedni model, logistična regresija, odločitveno drevo Published in DKUM: 27.08.2018; Views: 1728; Downloads: 225
Full text (1,01 MB) |
6. Uporaba biopsihosocialnih podatkov za napovedovanje obremenjenosti delavcev v zdravstveni organizacijiBiljana Pejčić, 2017, master's thesis Abstract: Izhodišče: Počutje delavca na delovnem mestu je izrednega pomena, saj le-to vpliva na delovno storilnost in na kakovost opravljenega dela. Psihosocialna tveganja povečujejo verjetnost za zdravstvene zaplete pri zaposlenih, kot so preobremenjenost, stres, izgorevanje, odsotnost z dela, s tem pa tudi prispevajo zmanjšano učinkovitost in storilnost na delovnem mestu in povečujejo težave pri usklajevanju dela z družinskimi obveznostmi.
Namen: Ugotoviti želimo stopnjo tveganja za razvoj težav, povezanih z biopsihosocialnimi dejavniki za zaposlene delavce v zdravstvenem domu in izdelati napovedni model za ocenjevanje obremenjenosti pri delavcih.
Metode: Raziskava temelji na kvantitativni metodi dela. Opravljena je bila analiza literature. S pomočjo OPSA anonimnega vprašalnika smo zbrane podatke analizirali v OPSA orodju ter jih statistično obdelali s pomočjo računalniških programov Excel 2007 in SPSS V24. Za napovedni model smo uporabili metodo linearne in logistične regresije ter odločitvena drevesa. Napovedno vrednost posameznih spremenljivk ter izdelanih napovednih modelov smo ocenjevali na osnovi naslednjih metrik: področje pod ROC krivuljo (AUC), senzitivnost, specifičnost, pozitivna napovedna vrednost in negativna napovedna vrednost.
Rezultati: Rezultati raziskave so pokazali, da so delavci obremenjeni na delovnem mestu. Na podlagi rezultatov smo dobili ne le povečano, ampak visoko tveganje na področju vloge in odgovornosti v organizaciji. Za povečano tveganje so bili vključeni faktorji delovne obremenitve ter hitrost poteka dela, sam odnos do dela, osebne značilnosti posameznika, organizacijska kultura, skrb zase, nadzor, delovno okolje in delovna oprema (fizične obremenitve), razvoj poklicne kariere, vsebine in urnik dela, psihofizično zdravstveno stanje ter razmejitev zasebnega življenja in dela.
Sklep: Za delavca je pomembno obvladovanje in posledično preprečevanje biopsihosocialnih tveganj, kar pripomorejo k zadovoljstvu delavca v delovnem okolju. Predvsem je potrebno ozaveščanje zaposlenih o tveganjih ter izvajanje promocije zdravja na delovnem mestu. Keywords: delavci, obremenjenost, povečano tveganje, delovno okolje, napovedni model Published in DKUM: 10.01.2018; Views: 1494; Downloads: 157
Full text (1,96 MB) |
7. Napovedovanje rehospitalizacij za paciente z multiplo sklerozoSanja Rikanović, 2016, master's thesis Abstract: V magistrskem delu smo raziskovali nenačrtovane ponovne sprejeme pri pacientih z multiplo sklerozo (MS). Cilj našega raziskovalnega dela je bil sestaviti model, ki bo pri napovedovanju nenačrtovanih ponovnih sprejemov uspešnejši od modelov, ki niso vezani na posamezno diagnozo.
Pri pisanju teoretičnega dela naloge smo se opirali na strokovno literaturo o multipli sklerozi ter na raziskave o modelih za napovedovanje nenačrtovanih ponovnih sprejemov. Za empirični del naloge smo uporabili podatke iz podatkovne baze SID (State Inpatient Database) za Kalifornijo, ki je del skupine podatkovnih baz, razvitih v okviru projekta HCUP (Healthcare Cost and Utilization Project).
Specializiran napovedni model, zgrajen na osnovi podatkov o pacientih z multiplo sklerozo, se je pri napovedovanju ponovnega sprejema bolnikov z MS v manj kot 30 dneh izkazal kot uspešnejši od globalnega modela, ki je bil zgrajen na osnovi podatkov o vseh pacientih ne glede na diagnozo. Povprečna AUC-vrednost specializiranega modela je znašala 0,708, kar je za 0,042 višje od povprečne AUC-vrednosti globalnega modela (AUC = 0,666). Prav tako smo pri specializiranem modelu zaznali višje povprečne vrednosti diagnostične natančnosti, senzitivnosti, specifičnosti in NPV. Dodaten prispevek specializiranega modela v primerjavi z globalnim modelom se kaže tudi v nižji Brierjevi oceni ter v manjšem številu uporabljenih vhodnih spremenljivk in posledično v manj kompleksnem modelu. Vse našteto govori v prid specializiranemu napovednemu modelu za paciente z MS, zato smo v naslednjem koraku temu modelu dodali še podatke o predhodnih hospitalizacijah in ugotovili, da vključitev zgodovinskih podatkov o hospitalizacijah prav tako pozitivno vpliva na napovedovanje nenačrtovanih ponovnih sprejemov.
Za napovedovanje nenačrtovanih ponovnih sprejemov pri pacientih z MS je bolje uporabiti specializiran model kot splošnega. Rezultati magistrskega dela so primerni za nadaljnje proučevanje rehospitalizacij pri pacientih z MS. Keywords: multipla skleroza, rehospitalizacija, bolnišnična odpustna pisma, napovedni model, Lasso regresija, ansambelske metode, odločitvena drevesa. Published in DKUM: 01.09.2016; Views: 2546; Downloads: 226
Full text (888,29 KB) |
8. NAPOVEDOVANJE ODPOVEDI IZDELKOV Z METODAMI STROJNEGA UČENJAAmira Mujanović, 2016, master's thesis/paper Abstract: Magistrska naloga obravnava razvoj modela za napovedovanje odpovedi izdelkov v garancijski dobi. Z odpovedovanjem izdelkov in problematiko zagotavljanja popravil v garancijski dobi se soočajo vsa proizvodna podjetja. Zagotavljanje popravil v garancijskem roku podjetjem predstavlja strošek, ki ga poskušajo minimizirati s pomočjo predvidevanja deležev odpovedi. Najpogosteje se napovedi izvedejo z empiričnimi modeli, ki so zgrajeni na preteklih podatkih o podobnih izdelkih in prilagojeni glede na izkušnje. V sklopu magistrske naloge smo s pomočjo različnih metod strojnega učenja in realnih podatkov razvili napovedni model in ocenili uspešnost napovedovanja. Najboljše rezultate napovedovanja smo dobili pri ansamblih regresijskih dreves, pri katerih smo podatke prilagodili eksponentnem modelu. Za zaključek smo pripravili priporočila kateri model uporabiti ob omejenem poznavanju podatkov o odpovedih. Keywords: Napovedni model, odpoved izdelka, garancijski rok, kakovost, strojno učenje, nevronske mreže, regresijska drevesa. Published in DKUM: 01.04.2016; Views: 1729; Downloads: 185
Full text (1,27 MB) |
9. STATISTIČNI PRISTOPI ZA ODKRIVANJE POVEZAV MED BIOKEMIJSKIMI, GENETSKIMI IN KLINIČNIMI PODATKI Z ODZIVOM NA ZDRAVLJENJE BOLNIKOV S CROHNOVO BOLEZNIJO Z ADALIMUMABOMJasmina Rebernak, 2015, master's thesis Abstract: Naredili smo celovito študijo s podatki iz članka (Koder et al., 2015) in doktorata (Koder, Silvo 2015). Namen naše raziskave je bila uporaba različnih statističnih pristopov (t-test neodvisnih vzorcev, anova, test dveh neodvisnih vzorcev, test k neodvisnih vzorcev, korelacije, linearna in logistična regresija) in z njimi odkriti povezave med biokemijskimi, kliničnimi in genetskimi podatki z odzivom na zdravljenje bolnikov s CB z adalimumabom. Uporabili smo programsko orodje SPSS in test normalne porazdelitve ShapiroWilk za izvedbo statističnih analiz. Odziv smo merili z vprašalnikom IBDQ in biokemijskim parametrom C-reaktivni protein (CRP). Za vsakega pacienta (N = 97) smo beležili 24 biokemijskih, 34 kliničnih in 34 genetskih podatkov. S kliničnim odzivom IBDQ se je dvakrat ponovilo pet polimorfizmov pri posameznemu genu. Trikrat so se ponovili trije biokemijski in šest kliničnih parametrov. Najbolj signifikantne povezave smo zaznali s PTGER4, CASP9, CCNY, sakroileitisom in alkalno fosfatazo. Z biološkim odzivom CRP se je dvakrat ponovilo devet povezav s polimorfizmi pri posameznem genu. Trikrat sta se ponovila dva biokemijska in eden klinični parameter. Za najbolj signifikantne so se izkazale povezave z ATG16L1, IL27, NR1|2 in c11orf30 ter albuminom. Z uporabo linearne in logistične (binarne) regresije smo izdelali napovedne modele za IBDQ in CRP. Z linearno regresijo smo dobili model z najvišjim R2 (0,691) za IBDQ v tridesetem tednu (natančnost: 69,32 %). Medtem ko smo najboljšo natančnost dobili za IBDQ v dvanajstem (76,00 %, R2 = 0,619) in dvajsetem (75,68 %, R2 = 0,567) tednu. Modeli za CRP so imeli R2 nad 0,980, vendar je njihova natančnost pod 61 %. Pri logistični regresiji je največjo natančnost imel model za IBDQ v četrtem tednu (R2 = 0,912; natančnost: 81,48 %). Natančnost modelov za odziv v dvanajstem (R2 = 0,482), dvajsetem (R2 = 0,465) in tridesetem (R2 = 0,653) tednu je znašala 71,43 %, 68,75 % in 64,10 %. Natančnost modelov za odziv CRP je znašala nad 70 %, vendar je to posledica manjkajočih podatkov in s tem manj veljavnih vzorcev. Ob koncu študije smo izdelali tabelo, s katero smo predstavili izbiro statističnega testa glede na biokemijske, klinične in genetske podatke. Keywords: Crohnova bolezen, adalimumab, statistične metode, Mann-Whitney, Fisher's Exact test, Chi square test, test neodvisnih vzorcev, linearna regresija, logistična regresija, napovedni model Published in DKUM: 22.10.2015; Views: 2259; Downloads: 326
Full text (2,47 MB) |
10. ZGODNJE NAPOVEDI STOPNJE ALFA-KISLIN V HMELJNI RASTLINI (Humulus lupulus L.) Z MODELI STROJNEGA UČENJAViljem Pavlovič, 2011, dissertation Abstract: Hmelj (Humulus lupulus L.) je ključna surovina v pivovarstvu, saj značilno vpliva na organoleptične lastnosti piva, vključno z okusom in aromo. Grenčice hmelja (alfa-kisline) so že vrsto let eden najpomembnejših parametrov kakovosti in s tem tržne vrednosti hmeljskih proizvodov v vseh državah pridelovalkah. Zgodnje napovedi vsebnosti alfa-kislin v storžkih slovenskih kultivarjev hmelja, so zato ključnega pomena tako za hmeljarje, kot tudi za trgovce s hmeljem. V pomoč slovenskim ekspertom pri ocenah letnega pridelka alfa-kislin smo zgradili modele za zgodnje napovedi vsebnosti alfa-kislin treh pomembnejših kultivarjev, ki jih gojimo v Sloveniji. Vsi trije kultivarji (Aurora, Savinjski golding in Bobek) se precej enotno odzivajo na meteorološke vplive v istem časovnem obdobju. V raziskavi so s podatki in izkušnjami sodelovali tudi raziskovalci Inštituta za hmeljarstvo in pivovarstvo Slovenije v Žalcu.
Analiza meteoroloških vplivov na območjih pridelave hmelja v Sloveniji je pokazala, da imajo močan vpliv na vsebnost alfa-kislin slovenskih kultivarjev predvsem nadpovprečno visoke temperature v obdobju nastajanja generativnih organov (r = –0,95, p < 0,001), padavine pa že v času intenzivne rasti hmeljne rastline (r = 0,94, p < 0,001), pri tem pa vpliv padavin ni linearen. Izračunali smo koeficient med logaritmirano vrednostjo skupne količine padavin od 21. maja do 22. julija in temperaturno vsoto od 18. junija do 22. julija. Soodvisnost med koeficientom (kTD) in vsebnostjo alfa-kislin modelnega kultivarja Virtual je močna (r = –0,94, p < 0,001) in statistično značilna. Precej enoten odziv kultivarjev Aurora, Savinjski golding in Bobek nam je omogočil gradnjo univerzalnega modela s pomočjo navideznega kultivarja Virtual in neodvisnih spremenljivk skupne količine padavin, temperaturnih vsot in teoretične potrebe po vodi za hmeljno rastlino.
Za preliminarno napoved vsebnosti alfa-kislin v hmelju smo razvili univerzalni model G2G2DSMO, ki ga sestavljata dva modela z različnim vplivom. Oba modela sta zgrajena z atributom temperaturnih vsot v časovnem intervalu med 18. junijem in 21. julijem (T2529). Model G2SMO vsebuje še neodvisno spremenljivko skupne količine padavin za obdobje od 21. maja do 21. julija (D2129), model G2DSMO pa neodvisno spremenljivko teoretične potrebe po vodi v istem časovnem obdobju (Dd2129).
Vpliv modela G2SMO na amalgamiran model G2G2DSMO je 60 %, s 40 % pa vpliva model G2DSMO. Povprečen model G2G2DSMO je dovolj natančen in robusten. Vrednost DW d-statistike = 1,91 dokazuje, da v modelu avtokorelacija ni prisotna. Model, ki smo ga v raziskavi razvili je v funkcijski obliki zapisan:
G2G2DSMO = 14,025 – 13,46.10-3 T2529 + 2,92.10-3 Dd2129 + 3,72.10-3.D2129.
S pomočjo značilnih konstant kultivarjev Aurora = 1,45, Savinjski_golding = 0,62 in Bobek = 0,92, ki smo jih izračunali, smo dobili napovedi vsebnosti alfa-kislin za posamezne kultivarje prve skupine. Vrednosti napovedanih odvisnih spremenljivk (Ki) so močno korelirane (rVirtual = 0,95, rAurora = 0,93, rSavinjski golding = 0,92, rBobek = 0,90) z njihovimi pravimi vrednostmi (Ci), ki so bile določene s kemijskimi analizami. Vse korelacije so statistično značilne pri stopnji tveganja manjši od 0,1 %.
Model, ki smo ga v nalogi razvili, bo lahko služil kot osnova za nadaljevanje dela v smeri izgradnje ekspertnega sistema za zgodnje ocene vsebnosti alfa-kislin v hmelju. V prihod-nosti bo možno vključiti v model še nove kultivarje hmelja, pri čemer bo potrebno dodatno izračunati njihove modelne konstante. Keywords: : napovedni model, strojno učenje, hmeljna rastlina, alfa-kisline, sušni management Published in DKUM: 31.05.2011; Views: 5336; Downloads: 399
Full text (2,71 MB) |