| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 3 / 3
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
Zbirka gradiv, ki so vezana na nacionalno infrastrukturo odprtega dostopa
2012

Opis: Nacionalno infrastrukturo odprtega dostopa sestavlja šest repozitorijev in portal Openscience.si, ki služi kot agregator gradiv, priporočilni sistem in detektor podobnih vsebin. Openscience.si agregira vsebine iz repozitorijev in tudi zunanjih virov (dLib, Videolectures.NET, CLARIN.si, revije SAZU, Arhiv družboslovnih podatkov, DKMORS in drugih virov. Nacionalno infrastrukturo odprtega dostopa smo začeli graditi leta 2012, v okviru projekta ODUN, ki je bil financiran iz sredstev Ministrstva za izobraževanje znanost in šport in Evropskih strukturnih skladov. Zbirka vsebuje članke, predstavitve, odprte podatke in druga gradiva, s katerimi smo predstavili to infrastrukturo.
Ključne besede: odprta znanost, odprto dostopni repozitoriji, raziskovalni podatki, nacionalna infrastruktura odprtega dostopa, detekcija plagiatov, priporočilni sistemi
Objavljeno v DKUM: 20.07.2020; Ogledov: 782; Prenosov: 13
URL Povezava na celotno besedilo
Gradivo je zbirka in zajema 8 gradiv!

2.
UPORABA NOSQL PODATKOVNIH BAZ ZA GENERIRANJE POROČIL DETEKTORJA PLAGIATOV
Mario Dietner, 2012, diplomsko delo

Opis: V diplomskem delu smo predstavili koncept podatkovnih baz NOSQL. Našteli smo osnovne skupine, jih opisali in našteli njihove pripadnike. Podrobneje smo se posvetili opisu podatkovnega sistema Apache Cassandra, njegovim lastnostim, delovanju in arhitekturi. Posebej so nas zanimale splošne lastnosti Cassandre, kot so elastičnost, razpoložljivost in ujemljivost podatkov ter zanesljivost in zmogljivost sistema v realnem okolju. V praktičnem delu diplomskega dela smo razvili sistem, ki uporablja Appache Cassandra za generiranje poročil o vsebinski podobnosti med dokumenti. Iskanje plagiatov je časovno zahteven proces, saj z naraščanjem števila dokumentov narašča tudi časovna zahtevnost iskanja. Cassandrina elastičnost in podatkovni model sta idealna rešitev za takšno iskanje. Za izvedbo preizkusa smo uporabili obstoječo bazo izvlečkov (angl. hash), ki smo jih pridobili iz dokumentov Digitalne knjižnice Univerze v Mariboru. To smo prenesli v Cassandrino gručo desetih strežnikov. Čase generiranja poročil smo primerjali s časi, ki smo jih dobili pri generiranju poročil iz podatkovne baze MS SQL. Pokazali smo, da Appache Cassandra 2,2-krat hitreje generira poročila in je neobčutljiva za izpade strežnikov.
Ključne besede: podatkovne baze NOSQL, Appache Casandra, teorem CAP, detekcija plagiatov
Objavljeno v DKUM: 15.06.2012; Ogledov: 2811; Prenosov: 258
.pdf Celotno besedilo (2,78 MB)

3.
IZDELAVA PROGRAMSKEGA PAKETA ZA PRIDOBIVANJE IN PRIMERJANJE BESEDIL IZ INTERNETA
Matej Petek, 2012, diplomsko delo

Opis: V diplomskem delu smo obdelali področje pridobivanja dokumentov iz različnih virov na internetu. V teoretičnem delu smo predstavili, kako delujejo spletni pajki, strežniki OAI-PMH in OAI-ORE ter orodje Appache Tika, ki omogoča pretvorbo različnih vrst dokumentov v tekstovno obliko in ekstrakcijo metapodatkov. Zatem smo na kratko predstavili naloge, ki jih rešujejo sistemi za obdelavo besedil v naravnem jeziku. V praktičnem delu smo izdelali programski paket za pridobivanje dokumentov iz interneta in primerjanje besedil iz teh dokumentov.
Ključne besede: procesiranje naravnega jezika, metapodatki, spletni pajki, OAI-PMH, detekcija plagiatov
Objavljeno v DKUM: 14.03.2012; Ogledov: 3091; Prenosov: 242
.pdf Celotno besedilo (2,57 MB)

Iskanje izvedeno v 0.04 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici