Abstract: | Naraščajoče število poslovnih domen, ki se lahko izrazijo v obliki omrežij, zahteva uporabo tehnologije podatkovnih baz grafov, pri čemer to področje nenehno razvija nove mehanizme za reševanje domenskih izzivov. V disertaciji se osredotočamo na preučevanje mehanizma omejitev kardinalnosti, ki izkorišča povezave osnovnega grafa z lastnostmi. Potreba po nadzoru števila povezav, ki se lahko ustvarijo med vozlišči v podatkovni bazi grafov, obstaja predvsem v domenah z močno povezanimi podatki, kot so družbena omrežja, bančne transakcije, recenzije izdelkov, senzorska omrežja v zasnovi interneta stvari (angl. Internet of Things), itn. Kot naš prispevek k reševanju teh izzivov v disertaciji formalno predstavimo abstraktni model k-vozlišče, ki omogoča formalno definicijo omejitev kardinalnosti na povezavah med dvema ali več vozlišči z uporabo teorije grafov, njihovo predstavitev ter implementacijo v sodobnih sistemih za upravljanje podatkovnih baz grafov.
V disertaciji smo najprej predstavili relevantne zasnove iz teorije grafov, na katerih temeljijo podatkovne baze grafov. Obstoječe definicije osnovnih zasnov podatkovnih baz grafov smo kasneje razširili in v definicijo sheme grafa z lastnostmi vključili omejitve kardinalnosti k-vozlišče.
Razen teoretične snovi, na kateri temelji predlagani model k-vozlišče, smo opravili tudi sistematičen pregled obstoječih pristopov za uveljavljanje omejitev kardinalnosti v relacijskih ter podatkovnih bazah NoSQL in podrobneje podatkovnih bazah grafov. Rezultati pregleda literature so pokazali, da obstaja raziskovalna vrzel, ko gre za zasnove in pristope za opredelitev in predstavitev kompleksnih omejitev kardinalnosti za podatkovne baze grafov, ki so validirane v praksi.
Z namenom naslavljanja omenjenega izziva, smo predstavili nov in izčrpen pristop imenovan model omejitev kardinalnosti k-vozlišče, ki vključuje specifikacijo omejitev kardinalnosti k-vozlišče nad povezavami med dvema ali več vozlišči, vizualni prikaz omejitev kardinalnosti na modelu grafa z lastnostmi ter implementacijo zagotavljanja omejitev kardinalnosti. Formalno smo predstavili abstraktno zasnovo omejitev kardinalnosti k-vozlišče in njihovih lastnosti ter sintakso za njihovo specifikacijo v podatkovni bazi grafov. Kot naslednji korak, model k-vozlišče podpira vizualni prikaz omejitev s pomočjo modela grafa z lastnostmi, kjer je možno prikazati vse elemente formalne definicije omejitev kardinalnosti k-vozlišče (vozlišča, hipervozlišča, povezave, lastnosti vozlišč/povezav ter minimalno in maksimalno kardinalnost). Kot zadnji korak smo predstavili tudi tri algoritma potrebna za implementacijo modela k-vozlišče v določeni podatkovni bazi grafov.
V drugem delu disertacije ocenjujemo uporabnost modela na primerih uporabe z izvedbo dveh ločenih študij primerov, kjer predstavljamo, kako je mogoče model implementirati na primerih uporabe odkrivanja goljufij pri recenziji izdelkov in klasifikacije podatkov o deležu kaznivih dejanj v mestnih soseskah. Pri obeh primerih se model k-vozlišče iskazal kot primeren pristop za uporabo omejitev kardinalnosti v različnih domenah, ki se lahko prikažejo kot grafi z lastnostmi.
Nato analiziramo učinkovitost delovanja modela k-vozlišče pri vstavljanju novih povezav v podatkovne baze grafov z različnim številom povezav in izhodno stopnjo vozlišč ter jo primerjamo s primerom, ko ni preverjanja omejitev kardinalnosti. Rezultati statistične analize potrjujejo stabilno delovanje modela k-vozlišče na različnih množicah podatkov v primerjavi s primerom brez preverjanja omejitev kardinalnosti. S povečanjem velikosti grafa učinkovitost modela k-vozlišče ostaja stabilna z majhnimi razlikami v primerjavi z manjšo velikostjo grafa. Na podlagi teh ugotovitev sklepamo, da model omejitev kardinalnosti k-vozlišče lahko služi kot mehanizem za uveljavljanje omejitev kardinalnosti brez signifikantnih vplivov na učinkovitost podatkovne baze. |
---|