| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 10 / 50
Na začetekNa prejšnjo stran12345Na naslednjo stranNa konec
1.
Metode za napovedovanje intervalnih spremenljivk na družboslovnih podatkih : diplomsko delo visokošolskega študijskega programa Informacijska varnost
Danijel Blagojević, 2024, diplomsko delo

Opis: Diplomsko delo obravnava uporabo metod podatkovnega rudarjenja za napovedovanje intervalnih spremenljivk v družboslovnih podatkovnih množicah, kjer je analiza velikih in kompleksnih podatkov pogosto izziv. Podatkovno rudarjenje omogoča odkrivanje skritih vzorcev in povezav, ki jih z običajnimi metodami analize težko zaznamo, ter omogoča napovedovanje prihodnjih dogodkov na osnovi preteklih podatkov. V nalogi so preučene različne metode, kot so linearna regresija, nevronske mreže, metoda k najbližjih sosedov (kNN), podporni vektorji (SVM) in odločitvena drevesa, pri čemer se raziskuje njihova učinkovitost pri obdelavi družboslovnih podatkov. Naloga vključuje primerjavo učinkovitosti teh metod z uporabo različnih metrik, kot so MSE, RMSE, MAE in R2, ki zagotavljajo celovito oceno natančnosti napovedi. Rezultati kažejo, da so nevronske mreže in linearna regresija med najuspešnejšimi metodami za napovedovanje intervalnih spremenljivk v družboslovnih podatkovnih množicah. Nevronske mreže izkazujejo posebno prednost pri odkrivanju skritih vzorcev v kompleksnih podatkovnih strukturah, medtem ko je linearna regresija učinkovita zaradi svoje preprostosti in razumljivosti. Raziskava poudarja pomen prilagajanja izbranih metod značilnostim podatkovnih množic in potrebam analize. Izpostavlja tudi, da lahko ustrezna izbira metode vpliva na uspešnost napovedovanja in natančnost pridobljenih rezultatov. S tem prispeva k razumevanju optimalnih pristopov za analizo družboslovnih podatkov in odpira možnosti za nadaljnje raziskave, zlasti pri uporabi naprednejših tehnik strojnega učenja in prilagoditvah obstoječih metod. Naloga tako ponuja smernice za izbiro ustreznih metod podatkovnega rudarjenja glede na zahteve družboslovnih raziskav in spodbuja nadaljnje raziskovalno delo na tem področju.
Ključne besede: podatkovno rudarjenje, metode, družboslovje, množice, metrike, diplomske naloge
Objavljeno v DKUM: 27.09.2024; Ogledov: 0; Prenosov: 21
.pdf Celotno besedilo (1006,06 KB)

2.
Uporaba metod strojnega učenja za oblikovanje profila obremenitve spletnih aplikacij
Yauhen Unuchak, 2024, magistrsko delo

Opis: V magistrskem delu je predstavljen razvoj modelov gručenja s pomočjo programskega jezika Python. Cilj dela je razviti prototip orodij za oblikovanje profila obremenitve pri testiranju zmogljivosti spletnih aplikacij na podlagi analize preteklega delovanja spletne aplikacije v produkcijskem okolju. Izdelava profila obremenitve za testiranje zmogljivosti spletnih aplikacij predstavlja ključno fazo obremenitvenega testiranja. Ta faza omogoča usklajevanje testnih podatkov in obsega z zahtevami naročnika ter dejanskimi uporabniškimi izkušnjami. Pri izdelavi profila je treba upoštevati uporabniške vloge, tipične scenarije delovanja in razmerje med različnimi scenariji, saj različne funkcionalnosti aplikacije porabijo različne vire strežnika. Obremenitveno testiranje vključuje simulacijo uporabniških scenarijev s specializirano programsko opremo, kot sta JMeter in LoadRunner. To rešitev lahko uporabljajo inženirji in IT-strokovnjaki pri oblikovanju profila obremenitve, ki se ukvarjajo z obremenitvenim testiranjem zmogljivosti spletnih aplikacij. V delu raziskujemo, kako odkriti uporabniške vzorce za izboljšanje oblikovanja profila obremenitve za testiranje zmogljivosti na podlagi analize zapisov (rudarjenja podatkov iz log-datotek) o delovanju spletne aplikacije v produkcijskem okolju. S pravilno zasnovanim profilom obremenitve je mogoče oceniti zmogljivost in stabilnost sistema ter simulirati realne uporabniške pogoje.
Ključne besede: profil obremenitve spletnih aplikacij, testiranje, podatkovno rudarjenje spletnih zapisov
Objavljeno v DKUM: 05.07.2024; Ogledov: 106; Prenosov: 11
.pdf Celotno besedilo (8,02 MB)

3.
Lastnosti biofizikalnih objav skozi čas : magistrsko delo
Dino Gačević, 2022, magistrsko delo

Opis: V zadnjih letih beležimo porast števila strokovnih in znanstvenih objav, sočasno s tem pa tudi število novo nastalih, interdisciplinarnih področij. Sem uvrščamo tudi področje biofizike, izbrano za izhodiščno točko naše raziskave. V magistrskem delu smo najprej z uporabo podatkovnega rudarjenja iz spletne baze PubMed pridobili nabor za področje relevantnih člankov, nato pa pripravili splošni pregled od leta 1900 naprej. Ugotovili smo, da je število objavljenih člankov, povprečno število avtorjev na članek ter delež člankov s ključnimi besedami skozi leta naraščal. S podatki o revijah z največ objavljenimi članki ter najpogostejšimi ključnimi besedami smo ponazorili trende, ki odražajo postopen prehod naravnanosti v splošno fiziko do specializiranosti v področje biofizike. Enak trend smo potrdili še z najpogostejšimi n-grami skozi leta ter analizo MeSH deskriptorjev. Podrobneje smo predstavili tudi trende držav z največ objavami ter ugotovili, da so do leta 2020 prednjačile ZDA, po letu 2020 pa je vodilno mesto prevzela Kitajska. Ogledali smo si še medsebojno povezovanje avtorjev oz. držav, iz katerih ti prihajajo. Z delitvijo rezultatov v tri obdobja smo prikazali postopno krepitev medsebojnega povezovanja. Nalogo smo zaokrožili s prikazom razvoja in trendov področja biofizike na podlagi analize MeSH deskriptorjev. Rezultati so pokazali, da se velik delež terminov prenese v nova obdobja. Povprečno se pojavi 21 % novih ter pozabi 11 % vseh terminov. Z analizo ugotovljenih terminov se je izkazalo, da močno prevladuje termin »strunarji«, ki poudarja področje biologije, za področje fizike pa so se kot najpomembnejši termini izkazali »algoritmi«, »epidemiološke metode« ter »akustika«, nedavno pa tudi »avtomatizacija«.
Ključne besede: podatkovno rudarjenje, analiza besedila, MeSH, kompleksne mreže
Objavljeno v DKUM: 28.10.2022; Ogledov: 729; Prenosov: 58
.pdf Celotno besedilo (3,24 MB)

4.
CRISP-DM procesni model za podatkovno rudarjenje
Tadej Roškarič, 2022, diplomsko delo

Opis: Z vedno večjim napredkom tehnologije je na voljo vse več kapacitet za shranjevanje in analizo podatkov, pri čemer podatkovne baze postajajo vse kompleksnejše in iz tega razloga potrebujemo standardizirane postopke za analitično procesiranje. Medpanožni standardni postopek za podatkovno rudarjenje CRISP-DM (angl. Cross-Industry Standard Process for Data Mining) je primer tovrstnega standarda, ki je od njegovega nastanka leta 1996 še vedno med glavnimi procesnimi modeli na področju podatkovnega rudarjenja v vseh gospodarskih sektorjih. V tem diplomskem delu opredelimo njegove posamezne faze in korake ter jih podrobno opišemo. Ker podatkovno rudarjenje zaradi njegove poslovne vrednosti pridobiva vedno večji pomen, se na tem področju pojavlja vse več alternativ, zato CRISP-DM primerjamo z modeloma SEMMA (angl. Sample, Explore, Modify, Model, Assess) in ASUM-DM (angl. Analytics Solutions Unified Method for Data Mining) z zaključkom, da slednja nista dovolj fleksibilna za status splošnega standarda. Pregledali smo ustrezno literaturo in opravili študijo primera, v kateri smo optimizirali marketinško kampanjo za bančne storitve na podlagi podatkov portugalske finančne institucije. Po analizi literature in končanem praktičnem primeru smo pretehtali vpliv posameznih faz na kakovost rezultatov in ugotovili, da je v akademskem svetu najmanj pokrita prav faza uvedbe, ki pa je v praksi nepogrešljivega pomena. Prav tako smo izpostavili nekatere ključne pomanjkljivosti, ki znotraj originalnega CRISP-DM procesnega modela niso rešene. V ta namen smo predlagali dodatne korake, kot so postopek zbiranja podatkov, razširitev procesa uvedbe modela in nova faza podatkovne etike. Na podlagi teh predlogov ugotavljamo, da potreba po razširitvi prvotnega CRISP-DM modela obstaja.
Ključne besede: CRISP-DM, podatkovno rudarjenje, Python, procesni model, strojno učenje
Objavljeno v DKUM: 13.10.2022; Ogledov: 571; Prenosov: 55
.pdf Celotno besedilo (2,24 MB)
Gradivo ima več datotek! Več...

5.
Evolucija prevladujočih paradigem in terminologije na področju raziskav sladkorne bolezni skozi prizmo teorije kompleksnih mrež : magistrsko delo
Luka Benkovič, 2022, magistrsko delo

Opis: Znanstveno-raziskovalna dejavnost v zadnjih desetletjih doživlja velik razmah, kar se med drugim odraža v naraščajočem številu znanstvenih in strokovnih del. Tovrstne objave so ključne za prenos in razvoj znanja, a črpanje uporabnega znanja iz vedno večjih zbirk znanstvenih del postaja vse težje. Vsak posameznik je namreč sposoben obdelati le omejeno količino informacij. Kaže se potreba po tem, da se razvijejo orodja, ki nam bodo iz velike količine podatkov pomagala pri luščenju in agregaciji uporabnih informacij. V magistrski nalogi se te problematike lotimo s podatkovnim rudarjenjem po podatkovni bazi PubMed in z orodij s področja teorije kompleksnih mrež. Kot primer obravnavamo raziskovalno področje sladkorne bolezni, ki zaradi svoje razširjenosti predstavlja pereč problem za sodobno družbo. V prvem delu naloge predstavimo način pridobivanja in obdelave podatkov ter njihove osnovne značilnosti. V nadaljevanju se osredinimo na vsebino raziskovalnih del, ki jo proučujemo na podlagi ključnih besed. Tukaj delujemo ob predpostavki, da so ključne besede dober odraz vsebine pripadajočega dela in lahko iz njih izpeljemo prevladujoče paradigme na področju. Najprej pogledamo pogostost pojavljanja oziroma frekvenco posameznih besed, iz česar sklepamo o njihovi pomembnosti. Ugotovimo, da nam zgolj preprosta frekvenca ne omogoča preučevanja časovnega razvoja pomembnosti, zato uvedemo način rangiranja besed v razrede. Besede z najvišjimi rangi predstavljajo temeljne pojme raziskovalnega področja. Srednje veliki rangi predstavljajo posamezne niše področja, medtem ko najnižji rangi odražajo specifiko posamezne raziskave. Na koncu se lotimo še povezovanja ključnih besed v kompleksne mreže, iz katerih vrednotimo relacije. Iz naših rezultatov je razvidno, da je mreža ključnih besed modularna z jasno izraženimi skupnostmi, na podlagi česar lahko razberemo interdisciplinarno povezovanje. Posebno pozornost namenimo tudi časovnemu razvoju mreže. Le-ta nenehno raste, medtem ko povprečna povezanost ne narašča monotono, temveč ima krivulja jasne vrhe v nekih prelomnih točkah raziskav. To implicira nova odrkitja, ki imajo za posledico umeščanje novih ključnih besed, terminologije oziroma paradigem v obstoječo strukturo.
Ključne besede: sladkorna bolezen, podatkovno rudarjenje, kompleksne mreže, razvoj terminologije
Objavljeno v DKUM: 08.04.2022; Ogledov: 999; Prenosov: 98
.pdf Celotno besedilo (2,63 MB)

6.
Napovedovanje prodaje z dodatnimi odprtimi podatkovnimi viri
Denis Kolman, 2021, magistrsko delo

Opis: Rešitev, predstavljena v nalogi, se osredotoča na izboljšanje procesa napovedovanja prodajnih rezultatov izdelkov ali storitev s pomočjo vpeljave dodatnih odprtih virov podatkov. Z nalogo želimo poudariti, kako enostavno lahko pridobimo podatke in jih zelo dragoceno uporabimo v procesu poslovanja. Za končno primerjavo in vrednotenje smo najprej postavili dva modela v različnih sistemih za napovedovanje prodajnih rezultatov na podlagi enega vira, to so zgodovinski podatki prodaje. V nadaljevanju smo napovedni model s historičnimi podatki nadgradili. Dodali smo še podatke o številu zabeleženih bolezni, ki smo jih pridobili preko spletnega portala z javno objavljenimi podatki (odprti podatki). Korelacija med omenjenimi podatki obstaja, vendar je povezovanje te vrste podatkov kompleksno, zato je interpretacija rezultatov po eni strani lahko zelo zahtevna, po drugi strani pa povsem logična in zanimiva. Cilj, ki smo si ga zadali, je torej pokazati tri različne modele za napovedovanje, jih primerjati in ugotoviti, kakšen doprinos prinesejo odprti podatki. Rezultati naloge so pokazali, da smo zgradili zelo dobro osnovo za nadaljnji razvoj rešitve in enostavno implementacijo v uporabo.
Ključne besede: Odprti (javni) podatki, napovedovanje, podatkovno rudarjenje, model CRISP-DM.
Objavljeno v DKUM: 07.12.2021; Ogledov: 931; Prenosov: 80
.pdf Celotno besedilo (2,29 MB)

7.
Implementacija sistema za klasifikacijo novic o vrednostnih papirjih
Jure Jakič, 2021, magistrsko delo

Opis: Klasifikacija novic o podjetjih predstavlja časovno zelo dolgotrajen proces, saj je vsako novico potrebno prebrati in ji na podlagi vsebine določiti vsebinski pomen. Z razvojem metod za podatkovno rudarjenje lahko ta proces avtomatiziramo, s čimer novice razvrščamo v zanemarljivem času. V okviru magistrskega dela smo razvili sistem pridobivanja, prečiščevanja in klasifikacije novic. Novice smo pridobivali iz brezplačnih spletnih virov ter si ustvarili korpus besedil, ki smo jih najprej obdelali z orodjem Orange ter nato zgradili napovedne modele z uporabo različnih algoritmov. S pomočjo vizualizacij in matrike zamenjav smo prikazali kakovost napovednih modelov ter jih na podlagi njihove uspešnosti ovrednotili. S pomočjo ML.NET knjižnice smo na koncu razvili sistem avtomatske klasifikacije, ki novice glede na njihovo vsebino z 80 % natančnostjo klasificira v skupine.
Ključne besede: podatkovno rudarjenje, klasifikacija tekstov, trgovanje, novice, vrednostni papir
Objavljeno v DKUM: 09.08.2021; Ogledov: 907; Prenosov: 55
.pdf Celotno besedilo (1,84 MB)

8.
Razvoj metodologije za avtomatično klasifikacijo elektronskih publikacij v univerzalno decimalno klasifikacijo – udk24112018
Matjaž Kragelj, 2019, doktorska disertacija

Opis: Čeprav so znanstveni in strokovni članki večinoma bibliografsko obdelani in imajo zapis v knjižničnem katalogu COBIB, ter s tem definiranega enega ali več vrstilcev iz sistema Univerzalne decimalne klasifikacije (UDK), je večina člankov, dostopnih prek portala Digitalne knjižnice Slovenije, predvsem s področja kulture (starejši članki iz revij in časopisov), ki takšnega zapisa nimajo. Na spletnem mestu Digitalne knjižnice Slovenije je mogoče preiskovanje dokumentov zgolj po polnem besedilu. To je trenutno najboljše orodje za preiskovanje starejših besedil, a uporaba in preiskovanja publikacij na tak način, zaradi pomanjkljivosti (slabša kvaliteta razpoznave besedila v časopisih in revijah starejšega tipa, uporaba stare slovenščine, itd.) in prevelikega števila vrnjenih zadetkov pri iskanju, ne nudi sodobne uporabniške izkušnje in uporabniku otežuje delo. Osnovni problem, ki ga naslavljamo v disertaciji je pomoč pri bibliografski obdelavi besedil, ki je še vedno v rokah človeških ekspertov. Izhajamo iz teze, da je s pomočjo metod strojnega učenja možno avtomatsko klasificirati besedila v ustrezen UDK vrstilec in s tem podpreti človeka pri bibliografski obdelavi zapisov. V ta namen smo po pristopu načrtovanja in razvoja razvili klasifikacijski model, ki smo ga uporabili za klasificiranje starih besedil, ki so bila doslej klasificirana večinoma zgolj posredno, preko klasifikacije celotne revije oz. časopisa, kot na primer "Časopisi. Tisk. Novinarstvo". V disertaciji smo razvili klasifikacijski model s pomočjo metod strojnega učenja, s katerimi smo uspeli avtomatsko klasificirati kakršnokoli besedilo s pomočjo Univerzalne decimalne klasifikacije. Med tehnikami strojnega učenja smo se poslužili nenadzorovanega in nadzorovanega učenja. V prvem koraku smo nad manjšo množico podatkov (900 člankov) nenadzorovano učenje uporabili za preverjanje sorodnosti med dodeljenimi UDK vrstilci s strani bibliotekarjev in izgrajenimi gručami s strani algoritma. V drugem koraku smo nad celotnim korpusom znanstvenega časopisja Digitalne knjižnice Slovenije (več kot 70.000 znanstvenih besedil) razvili klasifikacijske modele, kjer je bilo razmerje učne in testne množice je bilo 80/20 odstotkov. Ko smo potrdili uspešnost klasifikacijskih modelov nad znanstvenimi besedili, smo jih uporabili za klasifikacijo več kot 200.000 starejših besedil. Uporabili smo Naivni Bayesov klasifikator, Metodo podpornih vektorjev, Večslojni perceptron, Logistično regresijo in algoritem k najbližjih sosedov. Ustreznost klasifikacije starih besedil smo preverili s človeškimi eksperti – bibliotekarji. Potrdili smo domnevo, da lahko s pomočjo znanstvenih in strokovnih člankov, klasificiranih v UDK, v vsaj 80% primerov ponudimo avtomatsko določene UDK vrstilce za starejše gradivo, ki ni bibliotekarsko obdelano. Poudariti velja, da gre pri tem delu za človeško odločitev, testiranje s človeškimi eksperti, za oceno in presojo, ki lahko variira od odločevalca do odločevalca. Poleg oplemenitenja starejših besedil iz osemnajstega, devetnajstega in prve polovice dvajsetega stoletja s vsebinskimi oznakami UDK vrstilcev, ima raziskava praktično moč v vsakodnevni rabi. Z gledišča podpore avtomatske klasifikacije publikacij pri vsakodnevnem delu bibliotekarjev, vidimo moč implementacije raziskave v informacijski sistem, ki je bibliotekarju sposoben v realnem času ponuditi izračunane predloge za določitev primernih klasifikatorjev publikacije, ki jo obdeluje. Bibliotekar lahko pridobi s strani stroja "drugo mnenje" pri procesu dodeljevanja UDK vrstilcev publikaciji, ki jo obdeluje. Hkrati je metodologija lahko uporabljena na različnih področjih in podatkovnih bazah ter klasifikacijskih sistemih, ne zgolj za dodeljevanje UDK vrstilcev.
Ključne besede: Umetna inteligenca, strojno učenje, podatkovno rudarjenje, Univerzalna decimalna klasifikacija, klasifikacija besedil
Objavljeno v DKUM: 03.02.2021; Ogledov: 1464; Prenosov: 131
.pdf Celotno besedilo (4,35 MB)

9.
Uporaba metod strojnega učenja za izboljšanje spletnega vprašalnika
Duško Rodić, 2020, magistrsko delo

Opis: Zbiranje podatkov preko spletnega vprašalnika je v današnjem času pravzaprav stalnica, saj gre za hiter in učinkovit način za zajemanje podatkov iz širše populacije. Pogosto pa so vprašalniki predolgi in tudi kompleksne, zato ne zajemamo ciljne populacije in ne dobimo prave slike o raziskovanem stanju. Poseben primer je zajemanje podatkov z namenom ocene primernosti uporabe zalo-zmogljivega računalništva v oblaku za mala in srednje velika podjetja. Ta vprašalnik je namenjen zajemu vhodnih podatkov za večkriterijski model, ki omogoča oceno potenciala, ki v praksi ni v celoti zaživel. Izhajamo iz predpostavke, da je tudi kompleksnost vprašalnika vplivala na šibek odziv respondentov. Iz tega smo razvili raziskovalno vprašanje: »Ali je mogoče vprašalnik skrajšati s pomočjo strojnega učenja?«. Cilj magistrske naloge je, da s pomočjo metod strojnega učenja skušamo ugotoviti katera vprašanja največ prispevajo k oceni potenciala ter na ta način skrajšati vprašalnik. Problem smo reševali z uporabo metod strojnega učenja. V ta name smo analizirali večkriterijski model, vprašalnik za zajemanje podatkov, odgovore respondentov ter v programu Orange , ki poleg metod strojnega učenja vsebuje tudi vizualizacijo podatkov, IV analizirali prispevek posameznega vprašanja h končni oceni. Rezultati kažejo, da imajo nekateri kriteriji večji vpliv na končno oceno potenciala uporabe zelo-zmogljivega računalništva v oblaku, vendar se ti kriteriji nanašajo na splošne atribute primerov (npr. država, vrsta organizacije). Ob izločitvi trivialnih kriterijev napoved modela še vedno ni dovolj natančna, zato je edini zaključek, ki ga lahko potegnemo, da na pričujočih podatkih ni bilo možno izbrati takega nabora kriterijev oziroma vprašanj, s katerimi bi lahko natančno ocenili potencial uporabe zelo-zmogljivega računalništva v oblaku.
Ključne besede: - zelo-zmogljivo računalništvo, - oblak, - strojno učenje, - podatkovno rudarjenje, - Orange (program).
Objavljeno v DKUM: 23.12.2020; Ogledov: 1080; Prenosov: 88
.pdf Celotno besedilo (4,63 MB)

10.
Interaktivna vizualizacijska orodja za izboljševanje športnih treningov : magistrsko delo
Roman Šuster, 2020, magistrsko delo

Opis: Vsakodnevno se soočamo z veliko količino podatkov, ki jih generirajo elektronske naprave. Še več, ta količina se z dneva v dan celo povečuje in temu povečevanju ni videti konca. Vseprisotne elektronske naprave so korenito spremenile tudi življenje človeka. Med drugim te naprave beležijo naše odločitve, na podlagi katerih določajo naše preference, spremljajo naše nakupovalne navade v trgovinah, odkrivajo naše finančne navade in obnašanje na družbenih omrežjih. Zaradi vsega prej omenjenega so se razvile metode, ki omogočajo shranjevanje in obdelavo velike količine podatkov, ki jih danes označujemo z izrazom masivni podatki (angl. big data). V pričujočem magistrskem delu smo se lotili obdelave podatkov športnikov (natančneje kolesarjev) dobljenih iz športnih ur (npr. Polar, Garmin ipd.), ki spremljajo športnika med treningi. Na podlagi te analize lahko športni trener določi trende v obnašanju športnika znotraj predpisanih časovnih intervalov, na podlagi česar lahko ta ugotavlja, v kakšni trenutni formi je njegov varovanec in napovedati priporočila za njegov nadaljnji trening.
Ključne besede: podatkovno rudarjenje, analiza podatkov, vizualizacija, šport, spletna aplikacija
Objavljeno v DKUM: 04.11.2020; Ogledov: 1265; Prenosov: 87
.pdf Celotno besedilo (5,91 MB)

Iskanje izvedeno v 0.27 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici