| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Izpis gradiva

Naslov:UPORABA NOSQL PODATKOVNIH BAZ ZA GENERIRANJE POROČIL DETEKTORJA PLAGIATOV
Avtorji:ID Dietner, Mario (Avtor)
ID Ojsteršek, Milan (Mentor) Več o mentorju... Novo okno
Datoteke:.pdf UNI_Dietner_Mario_2012.pdf (2,78 MB)
MD5: 63694AFB7A00C4FEDE821DA3402CE43F
PID: 20.500.12556/dkum/db51f7f6-101a-4740-a262-bb457f7637f3
 
Jezik:Slovenski jezik
Vrsta gradiva:Diplomsko delo (m5)
Tipologija:2.11 - Diplomsko delo
Organizacija:FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Opis:V diplomskem delu smo predstavili koncept podatkovnih baz NOSQL. Našteli smo osnovne skupine, jih opisali in našteli njihove pripadnike. Podrobneje smo se posvetili opisu podatkovnega sistema Apache Cassandra, njegovim lastnostim, delovanju in arhitekturi. Posebej so nas zanimale splošne lastnosti Cassandre, kot so elastičnost, razpoložljivost in ujemljivost podatkov ter zanesljivost in zmogljivost sistema v realnem okolju. V praktičnem delu diplomskega dela smo razvili sistem, ki uporablja Appache Cassandra za generiranje poročil o vsebinski podobnosti med dokumenti. Iskanje plagiatov je časovno zahteven proces, saj z naraščanjem števila dokumentov narašča tudi časovna zahtevnost iskanja. Cassandrina elastičnost in podatkovni model sta idealna rešitev za takšno iskanje. Za izvedbo preizkusa smo uporabili obstoječo bazo izvlečkov (angl. hash), ki smo jih pridobili iz dokumentov Digitalne knjižnice Univerze v Mariboru. To smo prenesli v Cassandrino gručo desetih strežnikov. Čase generiranja poročil smo primerjali s časi, ki smo jih dobili pri generiranju poročil iz podatkovne baze MS SQL. Pokazali smo, da Appache Cassandra 2,2-krat hitreje generira poročila in je neobčutljiva za izpade strežnikov.
Ključne besede:podatkovne baze NOSQL, Appache Casandra, teorem CAP, detekcija plagiatov
Leto izida:2012
Založnik:[M. Dietner]
Izvor:Maribor
PID:20.500.12556/DKUM-36499 Novo okno
UDK:004.65(043.2)
COBISS.SI-ID:16235030 Novo okno
NUK URN:URN:SI:UM:DK:C09O9IT5
Datum objave v DKUM:15.06.2012
Število ogledov:2802
Število prenosov:258
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
Področja:KTFMB - FERI
:
Kopiraj citat
  
Skupna ocena:(0 glasov)
Vaša ocena:Ocenjevanje je dovoljeno samo prijavljenim uporabnikom.
Objavi na:AddThis
AddThis uporablja piškotke, za katere potrebujemo vaše privoljenje.
Uredi privoljenje...

Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Sekundarni jezik

Jezik:Angleški jezik
Naslov:USAGE OF NOSQL DATABASES FOR PLAGIAT DETECTOR REPORT GENERATION
Opis:In this diploma thesis we have introduced the concept of NOSQL databases. We described some of the NOSQL groups and represented their members. Next chapters are dedicated to the detailed description of Apache Cassandra, its attributes, architecture and how it works in general. We were especially interested in general attributes of Cassandra, like elastic scaling, availability and data consistency, reliability and performance with a real work load. Further, we developed a system which uses Apache Cassandra to generate reports on content similarity of documents. The search of plagiarism is a time consuming process and for each document added, time complexity grows. The elasticity and the data model of Apache Cassandra are an ideal solution for this problem. For the realization of our performance test, we used an existing database of hash values from the Digital library of the University of Maribor. We transferred those values to our cluster of ten servers and compared the measured report generation times from Apache Cassandra cluster to the measured report generation times from the MS SQL database. We have shown, that Apache Cassandra is generating reports 2,2 times faster and that it is insensitive for server failures.
Ključne besede:NSQL databases, Appache Casandra, CAP theorem, plagiat detection


Komentarji

Dodaj komentar

Za komentiranje se morate prijaviti.

Komentarji (0)
0 - 0 / 0
 
Ni komentarjev!

Nazaj
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici