| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 2 / 2
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
Deduplication of metadata : magistrsko delo
Martin Chuchurski, 2019, diplomsko delo

Opis: Duplicates are redundant data that increases the storage space needed as well as the serving cost. They also have a big impact on the search result quality of the database. Therefore, detecting and eliminating redundant data is crucial in restoring and maintaining the quality of the data stored as well as the database itself. Different methods have been used to detect duplicates. The most widely used are pattern matching algorithms, more precisely phonetic string matching algorithms. There is a wide variety of algorithms to choose from and we opted for the algorithms that best suited our needs. Jaccard, Jaro, Jaro-Winkler and Levenshtein distance algorithms were used in the development of our deduplication application. They were joined together to create a new hybrid approach for detecting duplicates in a metadata database. In a real database, the application showed promising results while maintaining relatively fast speeds and fairly small memory consumption.
Ključne besede: deduplikacija, metapodatki, besedilne metrike podobnosti, duplikat
Objavljeno v DKUM: 08.11.2019; Ogledov: 760; Prenosov: 68
.pdf Celotno besedilo (848,73 KB)

2.
PODATKOVNA DEDUPLIKACIJA V PRAKSI
Damijan Lipar, 2016, diplomsko delo/naloga

Opis: Diplomsko delo proučuje področje hrambe podatkov različnih struktur na različnih tipih medijev. Poiskati in uvesti želimo najustreznejšo strojno rešitev za upravljanje podatkov s procesom deduplikacije. Ugotovili bomo, kako lahko optimalno prihranimo prostor na dragih redundantnih diskovnih poljih. Z uvedbo strojne rešitve za dedupliciranje podatkov bi poslovni subjekti imeli vse informacije na enem, to je skupnem mestu. S tem bi dosegli, da bi bilo shranjevanje podatkov neprimerno bolj racionalno. Izbrano strojno rešitev bomo preizkusili v testnem okolju ter jo na koncu ovrednotili z vidika funkcionalnosti, stroškov in prihrankov.
Ključne besede: deduplikacija, redukcija podatkov, fiksna in spremenljiva dolžina bloka, varnostne kopije, EMC Data Domain, diskovno polje, All-Flash diskovna polja
Objavljeno v DKUM: 30.06.2016; Ogledov: 1048; Prenosov: 122
.pdf Celotno besedilo (3,64 MB)

Iskanje izvedeno v 0.08 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici