| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 10 / 48
Na začetekNa prejšnjo stran12345Na naslednjo stranNa konec
1.
Lastnosti biofizikalnih objav skozi čas : magistrsko delo
Dino Gačević, 2022, magistrsko delo

Opis: V zadnjih letih beležimo porast števila strokovnih in znanstvenih objav, sočasno s tem pa tudi število novo nastalih, interdisciplinarnih področij. Sem uvrščamo tudi področje biofizike, izbrano za izhodiščno točko naše raziskave. V magistrskem delu smo najprej z uporabo podatkovnega rudarjenja iz spletne baze PubMed pridobili nabor za področje relevantnih člankov, nato pa pripravili splošni pregled od leta 1900 naprej. Ugotovili smo, da je število objavljenih člankov, povprečno število avtorjev na članek ter delež člankov s ključnimi besedami skozi leta naraščal. S podatki o revijah z največ objavljenimi članki ter najpogostejšimi ključnimi besedami smo ponazorili trende, ki odražajo postopen prehod naravnanosti v splošno fiziko do specializiranosti v področje biofizike. Enak trend smo potrdili še z najpogostejšimi n-grami skozi leta ter analizo MeSH deskriptorjev. Podrobneje smo predstavili tudi trende držav z največ objavami ter ugotovili, da so do leta 2020 prednjačile ZDA, po letu 2020 pa je vodilno mesto prevzela Kitajska. Ogledali smo si še medsebojno povezovanje avtorjev oz. držav, iz katerih ti prihajajo. Z delitvijo rezultatov v tri obdobja smo prikazali postopno krepitev medsebojnega povezovanja. Nalogo smo zaokrožili s prikazom razvoja in trendov področja biofizike na podlagi analize MeSH deskriptorjev. Rezultati so pokazali, da se velik delež terminov prenese v nova obdobja. Povprečno se pojavi 21 % novih ter pozabi 11 % vseh terminov. Z analizo ugotovljenih terminov se je izkazalo, da močno prevladuje termin »strunarji«, ki poudarja področje biologije, za področje fizike pa so se kot najpomembnejši termini izkazali »algoritmi«, »epidemiološke metode« ter »akustika«, nedavno pa tudi »avtomatizacija«.
Ključne besede: podatkovno rudarjenje, analiza besedila, MeSH, kompleksne mreže
Objavljeno v DKUM: 28.10.2022; Ogledov: 141; Prenosov: 16
.pdf Celotno besedilo (3,24 MB)

2.
CRISP-DM procesni model za podatkovno rudarjenje
Tadej Roškarič, 2022, diplomsko delo

Opis: Z vedno večjim napredkom tehnologije je na voljo vse več kapacitet za shranjevanje in analizo podatkov, pri čemer podatkovne baze postajajo vse kompleksnejše in iz tega razloga potrebujemo standardizirane postopke za analitično procesiranje. Medpanožni standardni postopek za podatkovno rudarjenje CRISP-DM (angl. Cross-Industry Standard Process for Data Mining) je primer tovrstnega standarda, ki je od njegovega nastanka leta 1996 še vedno med glavnimi procesnimi modeli na področju podatkovnega rudarjenja v vseh gospodarskih sektorjih. V tem diplomskem delu opredelimo njegove posamezne faze in korake ter jih podrobno opišemo. Ker podatkovno rudarjenje zaradi njegove poslovne vrednosti pridobiva vedno večji pomen, se na tem področju pojavlja vse več alternativ, zato CRISP-DM primerjamo z modeloma SEMMA (angl. Sample, Explore, Modify, Model, Assess) in ASUM-DM (angl. Analytics Solutions Unified Method for Data Mining) z zaključkom, da slednja nista dovolj fleksibilna za status splošnega standarda. Pregledali smo ustrezno literaturo in opravili študijo primera, v kateri smo optimizirali marketinško kampanjo za bančne storitve na podlagi podatkov portugalske finančne institucije. Po analizi literature in končanem praktičnem primeru smo pretehtali vpliv posameznih faz na kakovost rezultatov in ugotovili, da je v akademskem svetu najmanj pokrita prav faza uvedbe, ki pa je v praksi nepogrešljivega pomena. Prav tako smo izpostavili nekatere ključne pomanjkljivosti, ki znotraj originalnega CRISP-DM procesnega modela niso rešene. V ta namen smo predlagali dodatne korake, kot so postopek zbiranja podatkov, razširitev procesa uvedbe modela in nova faza podatkovne etike. Na podlagi teh predlogov ugotavljamo, da potreba po razširitvi prvotnega CRISP-DM modela obstaja.
Ključne besede: CRISP-DM, podatkovno rudarjenje, Python, procesni model, strojno učenje
Objavljeno v DKUM: 13.10.2022; Ogledov: 142; Prenosov: 20
.pdf Celotno besedilo (2,24 MB)
Gradivo ima več datotek! Več...

3.
Evolucija prevladujočih paradigem in terminologije na področju raziskav sladkorne bolezni skozi prizmo teorije kompleksnih mrež : magistrsko delo
Luka Benkovič, 2022, magistrsko delo

Opis: Znanstveno-raziskovalna dejavnost v zadnjih desetletjih doživlja velik razmah, kar se med drugim odraža v naraščajočem številu znanstvenih in strokovnih del. Tovrstne objave so ključne za prenos in razvoj znanja, a črpanje uporabnega znanja iz vedno večjih zbirk znanstvenih del postaja vse težje. Vsak posameznik je namreč sposoben obdelati le omejeno količino informacij. Kaže se potreba po tem, da se razvijejo orodja, ki nam bodo iz velike količine podatkov pomagala pri luščenju in agregaciji uporabnih informacij. V magistrski nalogi se te problematike lotimo s podatkovnim rudarjenjem po podatkovni bazi PubMed in z orodij s področja teorije kompleksnih mrež. Kot primer obravnavamo raziskovalno področje sladkorne bolezni, ki zaradi svoje razširjenosti predstavlja pereč problem za sodobno družbo. V prvem delu naloge predstavimo način pridobivanja in obdelave podatkov ter njihove osnovne značilnosti. V nadaljevanju se osredinimo na vsebino raziskovalnih del, ki jo proučujemo na podlagi ključnih besed. Tukaj delujemo ob predpostavki, da so ključne besede dober odraz vsebine pripadajočega dela in lahko iz njih izpeljemo prevladujoče paradigme na področju. Najprej pogledamo pogostost pojavljanja oziroma frekvenco posameznih besed, iz česar sklepamo o njihovi pomembnosti. Ugotovimo, da nam zgolj preprosta frekvenca ne omogoča preučevanja časovnega razvoja pomembnosti, zato uvedemo način rangiranja besed v razrede. Besede z najvišjimi rangi predstavljajo temeljne pojme raziskovalnega področja. Srednje veliki rangi predstavljajo posamezne niše področja, medtem ko najnižji rangi odražajo specifiko posamezne raziskave. Na koncu se lotimo še povezovanja ključnih besed v kompleksne mreže, iz katerih vrednotimo relacije. Iz naših rezultatov je razvidno, da je mreža ključnih besed modularna z jasno izraženimi skupnostmi, na podlagi česar lahko razberemo interdisciplinarno povezovanje. Posebno pozornost namenimo tudi časovnemu razvoju mreže. Le-ta nenehno raste, medtem ko povprečna povezanost ne narašča monotono, temveč ima krivulja jasne vrhe v nekih prelomnih točkah raziskav. To implicira nova odrkitja, ki imajo za posledico umeščanje novih ključnih besed, terminologije oziroma paradigem v obstoječo strukturo.
Ključne besede: sladkorna bolezen, podatkovno rudarjenje, kompleksne mreže, razvoj terminologije
Objavljeno v DKUM: 08.04.2022; Ogledov: 492; Prenosov: 53
.pdf Celotno besedilo (2,63 MB)

4.
Napovedovanje prodaje z dodatnimi odprtimi podatkovnimi viri
Denis Kolman, 2021, magistrsko delo

Opis: Rešitev, predstavljena v nalogi, se osredotoča na izboljšanje procesa napovedovanja prodajnih rezultatov izdelkov ali storitev s pomočjo vpeljave dodatnih odprtih virov podatkov. Z nalogo želimo poudariti, kako enostavno lahko pridobimo podatke in jih zelo dragoceno uporabimo v procesu poslovanja. Za končno primerjavo in vrednotenje smo najprej postavili dva modela v različnih sistemih za napovedovanje prodajnih rezultatov na podlagi enega vira, to so zgodovinski podatki prodaje. V nadaljevanju smo napovedni model s historičnimi podatki nadgradili. Dodali smo še podatke o številu zabeleženih bolezni, ki smo jih pridobili preko spletnega portala z javno objavljenimi podatki (odprti podatki). Korelacija med omenjenimi podatki obstaja, vendar je povezovanje te vrste podatkov kompleksno, zato je interpretacija rezultatov po eni strani lahko zelo zahtevna, po drugi strani pa povsem logična in zanimiva. Cilj, ki smo si ga zadali, je torej pokazati tri različne modele za napovedovanje, jih primerjati in ugotoviti, kakšen doprinos prinesejo odprti podatki. Rezultati naloge so pokazali, da smo zgradili zelo dobro osnovo za nadaljnji razvoj rešitve in enostavno implementacijo v uporabo.
Ključne besede: Odprti (javni) podatki, napovedovanje, podatkovno rudarjenje, model CRISP-DM.
Objavljeno v DKUM: 07.12.2021; Ogledov: 432; Prenosov: 50
.pdf Celotno besedilo (2,29 MB)

5.
Implementacija sistema za klasifikacijo novic o vrednostnih papirjih
Jure Jakič, 2021, magistrsko delo

Opis: Klasifikacija novic o podjetjih predstavlja časovno zelo dolgotrajen proces, saj je vsako novico potrebno prebrati in ji na podlagi vsebine določiti vsebinski pomen. Z razvojem metod za podatkovno rudarjenje lahko ta proces avtomatiziramo, s čimer novice razvrščamo v zanemarljivem času. V okviru magistrskega dela smo razvili sistem pridobivanja, prečiščevanja in klasifikacije novic. Novice smo pridobivali iz brezplačnih spletnih virov ter si ustvarili korpus besedil, ki smo jih najprej obdelali z orodjem Orange ter nato zgradili napovedne modele z uporabo različnih algoritmov. S pomočjo vizualizacij in matrike zamenjav smo prikazali kakovost napovednih modelov ter jih na podlagi njihove uspešnosti ovrednotili. S pomočjo ML.NET knjižnice smo na koncu razvili sistem avtomatske klasifikacije, ki novice glede na njihovo vsebino z 80 % natančnostjo klasificira v skupine.
Ključne besede: podatkovno rudarjenje, klasifikacija tekstov, trgovanje, novice, vrednostni papir
Objavljeno v DKUM: 09.08.2021; Ogledov: 450; Prenosov: 30
.pdf Celotno besedilo (1,84 MB)

6.
Razvoj metodologije za avtomatično klasifikacijo elektronskih publikacij v univerzalno decimalno klasifikacijo – udk24112018
Matjaž Kragelj, 2019, doktorska disertacija

Opis: Čeprav so znanstveni in strokovni članki večinoma bibliografsko obdelani in imajo zapis v knjižničnem katalogu COBIB, ter s tem definiranega enega ali več vrstilcev iz sistema Univerzalne decimalne klasifikacije (UDK), je večina člankov, dostopnih prek portala Digitalne knjižnice Slovenije, predvsem s področja kulture (starejši članki iz revij in časopisov), ki takšnega zapisa nimajo. Na spletnem mestu Digitalne knjižnice Slovenije je mogoče preiskovanje dokumentov zgolj po polnem besedilu. To je trenutno najboljše orodje za preiskovanje starejših besedil, a uporaba in preiskovanja publikacij na tak način, zaradi pomanjkljivosti (slabša kvaliteta razpoznave besedila v časopisih in revijah starejšega tipa, uporaba stare slovenščine, itd.) in prevelikega števila vrnjenih zadetkov pri iskanju, ne nudi sodobne uporabniške izkušnje in uporabniku otežuje delo. Osnovni problem, ki ga naslavljamo v disertaciji je pomoč pri bibliografski obdelavi besedil, ki je še vedno v rokah človeških ekspertov. Izhajamo iz teze, da je s pomočjo metod strojnega učenja možno avtomatsko klasificirati besedila v ustrezen UDK vrstilec in s tem podpreti človeka pri bibliografski obdelavi zapisov. V ta namen smo po pristopu načrtovanja in razvoja razvili klasifikacijski model, ki smo ga uporabili za klasificiranje starih besedil, ki so bila doslej klasificirana večinoma zgolj posredno, preko klasifikacije celotne revije oz. časopisa, kot na primer "Časopisi. Tisk. Novinarstvo". V disertaciji smo razvili klasifikacijski model s pomočjo metod strojnega učenja, s katerimi smo uspeli avtomatsko klasificirati kakršnokoli besedilo s pomočjo Univerzalne decimalne klasifikacije. Med tehnikami strojnega učenja smo se poslužili nenadzorovanega in nadzorovanega učenja. V prvem koraku smo nad manjšo množico podatkov (900 člankov) nenadzorovano učenje uporabili za preverjanje sorodnosti med dodeljenimi UDK vrstilci s strani bibliotekarjev in izgrajenimi gručami s strani algoritma. V drugem koraku smo nad celotnim korpusom znanstvenega časopisja Digitalne knjižnice Slovenije (več kot 70.000 znanstvenih besedil) razvili klasifikacijske modele, kjer je bilo razmerje učne in testne množice je bilo 80/20 odstotkov. Ko smo potrdili uspešnost klasifikacijskih modelov nad znanstvenimi besedili, smo jih uporabili za klasifikacijo več kot 200.000 starejših besedil. Uporabili smo Naivni Bayesov klasifikator, Metodo podpornih vektorjev, Večslojni perceptron, Logistično regresijo in algoritem k najbližjih sosedov. Ustreznost klasifikacije starih besedil smo preverili s človeškimi eksperti – bibliotekarji. Potrdili smo domnevo, da lahko s pomočjo znanstvenih in strokovnih člankov, klasificiranih v UDK, v vsaj 80% primerov ponudimo avtomatsko določene UDK vrstilce za starejše gradivo, ki ni bibliotekarsko obdelano. Poudariti velja, da gre pri tem delu za človeško odločitev, testiranje s človeškimi eksperti, za oceno in presojo, ki lahko variira od odločevalca do odločevalca. Poleg oplemenitenja starejših besedil iz osemnajstega, devetnajstega in prve polovice dvajsetega stoletja s vsebinskimi oznakami UDK vrstilcev, ima raziskava praktično moč v vsakodnevni rabi. Z gledišča podpore avtomatske klasifikacije publikacij pri vsakodnevnem delu bibliotekarjev, vidimo moč implementacije raziskave v informacijski sistem, ki je bibliotekarju sposoben v realnem času ponuditi izračunane predloge za določitev primernih klasifikatorjev publikacije, ki jo obdeluje. Bibliotekar lahko pridobi s strani stroja "drugo mnenje" pri procesu dodeljevanja UDK vrstilcev publikaciji, ki jo obdeluje. Hkrati je metodologija lahko uporabljena na različnih področjih in podatkovnih bazah ter klasifikacijskih sistemih, ne zgolj za dodeljevanje UDK vrstilcev.
Ključne besede: Umetna inteligenca, strojno učenje, podatkovno rudarjenje, Univerzalna decimalna klasifikacija, klasifikacija besedil
Objavljeno v DKUM: 03.02.2021; Ogledov: 851; Prenosov: 76
.pdf Celotno besedilo (4,35 MB)

7.
Uporaba metod strojnega učenja za izboljšanje spletnega vprašalnika
Duško Rodić, 2020, magistrsko delo

Opis: Zbiranje podatkov preko spletnega vprašalnika je v današnjem času pravzaprav stalnica, saj gre za hiter in učinkovit način za zajemanje podatkov iz širše populacije. Pogosto pa so vprašalniki predolgi in tudi kompleksne, zato ne zajemamo ciljne populacije in ne dobimo prave slike o raziskovanem stanju. Poseben primer je zajemanje podatkov z namenom ocene primernosti uporabe zalo-zmogljivega računalništva v oblaku za mala in srednje velika podjetja. Ta vprašalnik je namenjen zajemu vhodnih podatkov za večkriterijski model, ki omogoča oceno potenciala, ki v praksi ni v celoti zaživel. Izhajamo iz predpostavke, da je tudi kompleksnost vprašalnika vplivala na šibek odziv respondentov. Iz tega smo razvili raziskovalno vprašanje: »Ali je mogoče vprašalnik skrajšati s pomočjo strojnega učenja?«. Cilj magistrske naloge je, da s pomočjo metod strojnega učenja skušamo ugotoviti katera vprašanja največ prispevajo k oceni potenciala ter na ta način skrajšati vprašalnik. Problem smo reševali z uporabo metod strojnega učenja. V ta name smo analizirali večkriterijski model, vprašalnik za zajemanje podatkov, odgovore respondentov ter v programu Orange , ki poleg metod strojnega učenja vsebuje tudi vizualizacijo podatkov, IV analizirali prispevek posameznega vprašanja h končni oceni. Rezultati kažejo, da imajo nekateri kriteriji večji vpliv na končno oceno potenciala uporabe zelo-zmogljivega računalništva v oblaku, vendar se ti kriteriji nanašajo na splošne atribute primerov (npr. država, vrsta organizacije). Ob izločitvi trivialnih kriterijev napoved modela še vedno ni dovolj natančna, zato je edini zaključek, ki ga lahko potegnemo, da na pričujočih podatkih ni bilo možno izbrati takega nabora kriterijev oziroma vprašanj, s katerimi bi lahko natančno ocenili potencial uporabe zelo-zmogljivega računalništva v oblaku.
Ključne besede: - zelo-zmogljivo računalništvo, - oblak, - strojno učenje, - podatkovno rudarjenje, - Orange (program).
Objavljeno v DKUM: 23.12.2020; Ogledov: 626; Prenosov: 49
.pdf Celotno besedilo (4,63 MB)

8.
Interaktivna vizualizacijska orodja za izboljševanje športnih treningov : magistrsko delo
Roman Šuster, 2020, magistrsko delo

Opis: Vsakodnevno se soočamo z veliko količino podatkov, ki jih generirajo elektronske naprave. Še več, ta količina se z dneva v dan celo povečuje in temu povečevanju ni videti konca. Vseprisotne elektronske naprave so korenito spremenile tudi življenje človeka. Med drugim te naprave beležijo naše odločitve, na podlagi katerih določajo naše preference, spremljajo naše nakupovalne navade v trgovinah, odkrivajo naše finančne navade in obnašanje na družbenih omrežjih. Zaradi vsega prej omenjenega so se razvile metode, ki omogočajo shranjevanje in obdelavo velike količine podatkov, ki jih danes označujemo z izrazom masivni podatki (angl. big data). V pričujočem magistrskem delu smo se lotili obdelave podatkov športnikov (natančneje kolesarjev) dobljenih iz športnih ur (npr. Polar, Garmin ipd.), ki spremljajo športnika med treningi. Na podlagi te analize lahko športni trener določi trende v obnašanju športnika znotraj predpisanih časovnih intervalov, na podlagi česar lahko ta ugotavlja, v kakšni trenutni formi je njegov varovanec in napovedati priporočila za njegov nadaljnji trening.
Ključne besede: podatkovno rudarjenje, analiza podatkov, vizualizacija, šport, spletna aplikacija
Objavljeno v DKUM: 04.11.2020; Ogledov: 658; Prenosov: 40
.pdf Celotno besedilo (5,91 MB)

9.
Podatkovno rudarjenje pri iskanju najkoristnejšega posameznika košarkarske lige nba : diplomsko delo
Jaša Kšela, 2020, diplomsko delo

Opis: Diplomsko delo prikazuje uporabo različnih metod podatkovnega rudarjenja, kot pomoč pri iskanju najkoristnejšega igralca ameriške profesionalne košarkarske lige NBA. Podatkovna baza je bila ustvarjena s pomočjo spletnega luščenja. Izluščene podatke smo nato vizualno predstavili in s pomočjo izvedenih metod strojnega učenja nad njimi poizkušali napovedati prihodnjega najkoristnejšega posameznika. Metode smo na koncu med seboj primerjali.
Ključne besede: podatkovno rudarjenje, košarka, strojno učenje, NBA, šport
Objavljeno v DKUM: 03.11.2020; Ogledov: 548; Prenosov: 49
.pdf Celotno besedilo (993,75 KB)

10.
Rekurzivna delitev modelov linearne regresije za oceno zanimivosti asociativnih pravil v različnih časovnih obdobjih
Goran Hrovat, 2018, doktorska disertacija

Opis: Zanimivosti asociativnih pravil ali pogostih množic postavk se lahko skozi čas spreminjajo. Prav tako je lahko njihova zanimivost različna za različne skupine (npr. skupine ljudi). V doktorski disertaciji je predstavljen nov algoritem za določanje zanimivosti asociativnih pravil in množic postavk v različnih časov¬nih obdobjih. Algoritem odkriva skupine pacientov, ki se glede na trend zanimivosti asociativnega pravila statistično značilno razlikujejo. Rezultat algoritma je odločitveno regresijsko drevo, katerega povezave predstavljajo različne skupine pacientov, listi pa prikazujejo grafe z zanimivostmi asociativnega pravila ali množice postavk v različnih časovnih obdobjih. Pokazali smo tudi, da podpora pogoste množice postavk vpliva na kompleksnost zgrajenega regresijskega drevesa. Za demonstracijo smo uporabili elektronske zdravstvene zapise, zbrane v obdobju 15 let, ki predstavljajo odpuste pacientov iz različnih bolnišnic v Združenih državah Amerike. Predstavljeni algoritem predstavlja v tem primeru uporabno vrednost za bolnišnice, zavarovalnice, raziskovalne in ostale institucije, saj jih lahko odkrito znanje vodi do novih spoznanj in optimizacije poslovanja.
Ključne besede: podatkovno rudarjenje, mere zanimivosti, asociativna pravila, podpora odločanju, regresijsko dre-vo, linearna regresija, elektronski zdravstveni zapis
Objavljeno v DKUM: 12.07.2018; Ogledov: 1664; Prenosov: 110
.pdf Celotno besedilo (17,46 MB)

Iskanje izvedeno v 0.33 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici