1. Implementacija odločitvenih dreves v programskem jeziku Python : diplomsko deloGregor Gorjanc, 2020, diplomsko delo Opis: V diplomskem delu je predstavljeno področje strojnega učenja, del katerega so odločitvena drevesa. Čeprav je odločitveno drevo v osnovi pripomoček za vizualizacijo, nas v sklopu strojnega učenja zanima proces gradnje. Obstaja več algoritmov, ki s pomočjo podatkovnih množic generirajo odločitvena drevesa. V delu je podrobno predstavljeno delovanje algoritma C4.5, čigar implementacija predstavlja jedro naloge. Algoritem je bil implementiran s pomočjo programskega jezika Python. Po osnovni implementacijo je bil izveden proces optimizacije, kjer so preizkušene različne strukture programskega jezika Python. Po optimizaciji je bila izvedena primerjalna analiza delovanja. Izvedena je bila tudi primerjava delovanja implementiranega algoritma z obstoječo implementacijo J48. Ključne besede: strojno učenje, odločitveno drevo, Python, C4.5 Objavljeno v DKUM: 03.07.2020; Ogledov: 1801; Prenosov: 274
Celotno besedilo (2,12 MB) |
2. Uporaba strojnega učenja za napovedovanje škodnih dogodkovVito Čoh, 2020, magistrsko delo Opis: V magistrskem delu je predstavljena uporaba posplošenega linearnega modela in različnih metod strojnega učenja v zavarovalništvu. Delo je razdeljeno na teoretični in praktični del.
Na začetku teoretičnega dela so opisani osnovni pojmi iz verjetnosti in zavarovalništva. Predstavljeno je tudi, kako zavarovalnice določijo višino premije. Nato sta predstavljena teoretično ozadje posplošenega linearnega modela in uporaba tega modela za napovedovanje višine škode. Na koncu teoretičnega dela pa je opisano strojno učenje in bolj podrobno so predstavljena odločitvena drevesa, naključni gozdovi ter nevronske mreže.
V praktičnem delu magistrskega dela pa so posplošeni linearni model, naključni gozd in nevronska mreža uporabljeni za napovedovanje višine škode pri avtomobilskem zavarovanju. Najprej so podatki predstavljeni ter ustrezno obdelani. Nato so določeni parametri posameznih modelov. Na koncu pa so modeli med seboj primerjani in izbran je najboljši model. Ključne besede: zavarovalništvo, posplošeni linearni model, strojno učenje, odločitveno drevo, naključni gozd, nevronska mreža Objavljeno v DKUM: 09.06.2020; Ogledov: 1857; Prenosov: 186
Celotno besedilo (1,53 MB) |
3. Modeliranje prostorskega vzorca vremensko pogojenih cestnoprometnih nesreč v SlovenijiNina Horvat, 2019, magistrsko delo Opis: Namen magistrskega dela je bil preučiti trende in prostorski vzorec prometnih nesreč, ki so se v obdobju 2006–2017 končale s smrtjo ali hudo telesno poškodbo, v vseh slovenskih občinah in po posameznih vremenskih situacijah (dež, megla, veter, sneg, toča, jasno in oblačno vreme). Naši cilji so bili predstaviti prometne nesreče na splošno, pregledati trende prometnih nesreč na svetovni, evropski in državni ravni, predstaviti vpliv vremena na prometne nesreče, preučiti metode za proučevanje prostorskih vzorcev prometnih nesreč ter analizirati prostorski vzorec izbranih prometnih nesreč. Podatke o prometnih nesrečah smo pridobili na spletni strani Javne agencije Republike Slovenije za varnost prometa in na Statističnem uradu Republike Slovenije, obdelovali smo jih s pomočjo programov Excel, ArcGIS 10.5 in R. Za vsako omenjeno vremensko situacijo smo izdelali prostorski vzorec, trend in standardizirano stopnjo prometnih nesreč. Izbrali smo spremenljivke, ki značilno vplivajo na število prometnih nesreč. Le-te smo v nadaljevanju transformirali s faktorsko analizo, da smo zagotovili pogoje uporabe linearnih modelov (nekoreliranost prediktorskih spremenljivk). Odvisne in neodvisne spremenljivke smo vstavili v model GWR, za katerega pa se je izkazalo, da ni dober napovedovalec števila prometnih nesreč, ko gre za posamezno vremensko situacijo. Posledično smo uporabili še metodo gradnje odločitvenega drevesa (ang. decision tree model). Sestavili smo algoritme, ki z zadovoljivo točnostjo napovedujejo število prometnih nesreč v posamezni občini glede na obravnavano vremensko situacijo. Kakovost modelov odločitvenega drevesa smo izmerili s pomočjo kazalcev: pojasnjen odklon (ang. explained deviance), MAE (ang. mean absolute error), RMSE (ang. ruth mean square error) in Moranov indeks avtokorelacije (ang. Moran's Index). Rezultati naloge imajo aplikativen pomen za snovalce strategije prometne varnosti na nacionalnem nivoju. Ključne besede: prometne nesreče, prostorski vzorec, vremenske okoliščine, geografsko obtežena regresija, odločitveno drevo Objavljeno v DKUM: 27.08.2019; Ogledov: 1264; Prenosov: 223
Celotno besedilo (6,11 MB) |
4. Pametni namakalni sistemTilen Gorečan, 2018, diplomsko delo/naloga Opis: Namen diplomskega dela je bil sestaviti in nastaviti pametni namakalni sistem, ki bi sam prožil začetek namakanja v primeru primanjkljaja vlage v tleh ali v primeru previsoke temperature omogočil hlajenje. Sistem je bil sprogramiran za dve poljščini, koruzo in krompir, ob uporabi dveh različnih tipal, vlage in temperature, ter nastavljen za lahka in srednje težka tla. Glavna enota pametnega namakalnega sistema je bila platforma Waspmote, ki je krmilila elektromagnetni ventil in nadzirala meritve senzorjev vlažnosti tal in temperature. Vse to je bilo doseženo s pomočjo dodatnih elektronskimi komponentami kot so aktivni USB razdelilnik, rele, DC – DC pretvornik in 12 V usmernik. Prišli smo do zaključka, da sistem pri nastavljenih parametrih vlage in temperature deluje avtonomno in primerno odreagira na izmerjene vhodne parametre. Ključne besede: Namakanje, pametni namakalni sistem, vlaga v tleh, odločitveno drevo. Objavljeno v DKUM: 12.09.2018; Ogledov: 2720; Prenosov: 166
Celotno besedilo (1,32 MB) |
5. Napovedovanje tveganja za ponovno hospitalizacijo pacientov s sladkorno boleznijo na osnovi podatkov o bolnišničnih obravnavahNives Zeme, 2018, magistrsko delo Opis: Izhodišča: Sladkorna bolezen sodi med kronične bolezni, ki zaradi svoje velike pogostosti ter zahtevne in kompleksne obravnave predstavljajo velik javno-zdravstveni problem. Ponovni bolnišnični sprejemi odražajo pomanjkljivosti v zdravstvenem sistemu. S pomočjo metod strojnega učenja in podatkov javnega značaja lahko določimo indikatorje, ki statistično značilno vplivajo na ponovno hospitalizacijo. Na podlagi določenih indikatorjev izdelamo napovedne modele za identifikacijo bolnikov, ki so ogroženi za ponovno hospitalizacijo.
Raziskovalne metode: V magistrskem delu smo za teoretična izhodišča uporabili deskriptivno metodo zbiranja podatkov. Raziskava v empiričnem delu je temeljila na deskriptivni inferenčni statistični metodi. S statističnim programskim orodjem IBM SPSS 22.0 smo zgradili napovedni model za tveganje ponovne hospitalizacije bolnikov s sladkorno boleznijo. Posamezne spremenljivke smo preverili in statistično analizirali s pomočjo testa hi-kvadrat in neparametričnega testa Mann-Whitney U.
Rezultati: Ugotovili smo, da nekateri indikatorji vplivajo na tveganje za ponovno hospitalizacijo v 30 dneh po odpustu iz bolnišnice. Za statistično značilne indikatorje so se izkazali: starost bolnika 74 let [95-odstotni IZ 74,75]; p < 0,001, ležalna doba 7 dni [95-odstotni IZ 7,8]; p < 0,001, število diagnoz 6 [95-odstotni IZ 6,6]; p = 0,047, število procedur 5 [95-odstotni IZ 5,6]; p < 0,000 in mesec odpusta iz bolnišnice 5 [95-odstotni IZ 5,5]; p = 0,001. Pri napovedovanju ponovne hospitalizacije bolnikov v slovenskih in kalifornijskih bolnišnicah obstajajo enaki indikatorji, vendar se med seboj statistično značilno razlikujejo.
Diskusija in zaključek: Napovedovanje tveganja za ponovno hospitalizacijo vključuje dobro poznavanje lastnosti bolnika. Te so: zdravstveno stanje, socialno-demografski dejavniki in uporaba zdravstvenih storitev. Pomembna je opredelitev in razumevanje indikatorjev (spremenljivk) ter njihovih vrednosti, ki vplivajo na ponovno hospitalizacijo bolnikov s sladkorno boleznijo. Ključne besede: sladkorna bolezen, ponovna hospitalizacija, podatki o bolnišničnih obravnavah, napovedni model, logistična regresija, odločitveno drevo Objavljeno v DKUM: 27.08.2018; Ogledov: 1728; Prenosov: 222
Celotno besedilo (1,01 MB) |
6. |
7. DINAMIČNI PARALELIZEM NA GPEFilip Urh, 2015, diplomsko delo Opis: V diplomskem delu preučimo in predstavimo novo funkcionalnost arhitekture CUDA. Gre za dinamični paralelizem, ki omogoča poganjanje programskih jeder neposredno iz grafične procesne enote. V začetku podrobno predstavimo arhitekturo CUDA in algoritem CART za gradnjo odločitvenih dreves, ki smo ga uporabili za demonstracijo uporabe dinamičnega paralelizma. Algoritem smo implementirali v zaporedni različici na CPE ter v paralelnih različicah z in brez dinamičnega paralelizma na GPE. Predstavili smo primerjalne meritve časov izvajanja vseh treh implementacij in ugotovili, da uporaba dinamičnega paralelizma omogoča krajši čas izvajanja in lažjo implementacijo algoritma. Ključne besede: grafična procesna enota, odločitveno drevo, CART, CUDA, dinamični paralelizem Objavljeno v DKUM: 14.10.2015; Ogledov: 1854; Prenosov: 110
Celotno besedilo (2,76 MB) |
8. INDUKTIVNO UČENJE IZ OPAZOVANJMiha Pišorn, 2014, diplomsko delo Opis: V diplomskem delu predstavimo učenje iz podatkov, kot model predvidevanja uporabimo odločitvena drevesa. Preučimo problem prekomernega prilagajanja in pogoste metode za njegovo omiljenje. Ansambelsko učenje je koncept v okviru umetne inteligence, ki združuje metode, ki sestavijo nabor klasifikatorjev in klasificirajo nove vhodne podatke na podlagi glasovanja. Te metode preučimo in pokažemo, zakaj se pogosto odrežejo bolje od posameznih klasifikatorjev. Implementiramo pogosto uporabljan algoritem Adaboost in preizkusimo njegovo obnašanje. Kot klasifikatorje uporabimo odločitvena drevesa. Ključne besede: umetna inteligenca, strojno učenje, odločitveno drevo, ansambelsko učenje, Adaboost Objavljeno v DKUM: 06.03.2015; Ogledov: 2845; Prenosov: 163
Celotno besedilo (2,45 MB) |
9. PODATKOVNE STORITVE ADO.NET IN ADO.NET ENTITY FRAMEWORKFranc Volavc, 2012, diplomsko delo Opis: V diplomskem delu smo predstavili Microsoftovi ogrodji ADO.NET in ADO.NET Entity Framework. Preučili in analizirali smo metode za dostop do podatkovnih virov, ki jih ponujata ogrodji, ter nato te ugotovitve preslikati v odločitveno drevo, katero bo programerjem in razvijalcem informacijskih sistemov pomagalo pri odločanju glede pristopa za dostop do podatkovnih virov. Ker bomo v diplomskem delu predstavili Microsoftovi ogrodji, bomo posledično omejeni zgolj na Microsoftovo tehnologijo, se pravi na tehnologijo .NET Framework 7. Ključne besede: ADO.NET, ADO.NET Entity Framework, .NET Framework, analiza, odločitveno drevo Objavljeno v DKUM: 16.11.2012; Ogledov: 1924; Prenosov: 154
Celotno besedilo (1,45 MB) |
10. MODELIRANJE ODLOČITVENEGA ZNANJA ZA OBRAVNAVO NEPLAČNIKOVMateja Lepoša, 2012, diplomsko delo Opis: Problem v podjetju mobilnega operaterja so neplačniki računov. Neplačniki nastanejo tako, da ne plačajo svojih računov, kljub temu, da jim pošljejo opomine in jih opozorijo pred izključitvijo telefonske številke, tukaj pa pride do problemov, ker določene stranke ne morejo poplačati svojih dolgov. Namen diplomske naloge je, pregledati vsakega neplačnika, saj med temi neplačniki obstaja določen odstotek, ki tega dolga ne bodo mogli poplačati zaradi določenih kriterijev, ki jih omenjamo v diplomski nalogi. Tako ne bo prišlo do tožbe in izbrano podjetje si ne bo delalo dodatnih stroškov. Pri tem problemu si pomagamo s teorijo ekspertnih sistemov in odločitvenih dreves. Pri odločitvenih drevesih nam najbolj pomaga zgradba odločitvenih dreves, saj tako pravilno narišemo odločitveno drevo. Morebitni rezultati se ne bodo takoj pokazali. Potreben bo čas in potrpežljivost, vendar se s to rešitvijo ukvarjajo določeni strokovni delavci, ne pa pravniki, kakor je bilo do sedaj. S tem se bo podjetje zaščitilo in tožeče stranke, ki niso zmožne poplačati dolga, bodo dali v odpis oziroma arhiv. Z odločitvenimi drevesi se bodo odločali zaposleni, ki bodo strokovno izobraženi v tej smeri, saj so zdaj o tem problemu, ki je znotraj podjetja, odločali pravniki. Pravniki bodo imeli čas za druge pravne zadeve, ne pa več za neplačnike, kar jim je vzelo precej časa. Ključne besede: odločitveno drevo, neplačnik, tožba Objavljeno v DKUM: 13.11.2012; Ogledov: 1650; Prenosov: 146
Celotno besedilo (526,75 KB) |