| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


1 - 1 / 1
First pagePrevious page1Next pageLast page
1.
UPORABA NOSQL PODATKOVNIH BAZ ZA GENERIRANJE POROČIL DETEKTORJA PLAGIATOV
Mario Dietner, 2012, undergraduate thesis

Abstract: V diplomskem delu smo predstavili koncept podatkovnih baz NOSQL. Našteli smo osnovne skupine, jih opisali in našteli njihove pripadnike. Podrobneje smo se posvetili opisu podatkovnega sistema Apache Cassandra, njegovim lastnostim, delovanju in arhitekturi. Posebej so nas zanimale splošne lastnosti Cassandre, kot so elastičnost, razpoložljivost in ujemljivost podatkov ter zanesljivost in zmogljivost sistema v realnem okolju. V praktičnem delu diplomskega dela smo razvili sistem, ki uporablja Appache Cassandra za generiranje poročil o vsebinski podobnosti med dokumenti. Iskanje plagiatov je časovno zahteven proces, saj z naraščanjem števila dokumentov narašča tudi časovna zahtevnost iskanja. Cassandrina elastičnost in podatkovni model sta idealna rešitev za takšno iskanje. Za izvedbo preizkusa smo uporabili obstoječo bazo izvlečkov (angl. hash), ki smo jih pridobili iz dokumentov Digitalne knjižnice Univerze v Mariboru. To smo prenesli v Cassandrino gručo desetih strežnikov. Čase generiranja poročil smo primerjali s časi, ki smo jih dobili pri generiranju poročil iz podatkovne baze MS SQL. Pokazali smo, da Appache Cassandra 2,2-krat hitreje generira poročila in je neobčutljiva za izpade strežnikov.
Keywords: podatkovne baze NOSQL, Appache Casandra, teorem CAP, detekcija plagiatov
Published: 15.06.2012; Views: 2317; Downloads: 209
.pdf Full text (2,78 MB)

Search done in 0.02 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica