| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 8 / 8
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
Izdelava programske rešitve za izvajanje bibliometričnih raziskav in gradnjo tezavrov iz velikih količin bibliometričnih podatkov
Boris Vezenšek, 2019, diplomsko delo

Opis: V diplomskem delu je obravnavana bibliometrija in bibliometrične analize, izvedene s pomočjo izdelane programske rešitve. Opisane so tehnologije, uporabljene za rešitev našega problema. Tukaj gre predvsem za delovanje Hadoopovega porazdeljenega datotečnega sistema HDFS in modela MapReduce ter sistema Apache Spark. Opisani sta tudi rešitvi Analysis Services Tabular in Power BI. Na koncu so na izbranih primerih predstavljeni rezultati različnih bibliometričnih analiz v orodju Power BI, ki se napaja iz podatkovnega modela, implementiranega v tem diplomskem delu. Rezultati so prikazani v različni obliki – z vizualizacijami, primernimi za takšno vrsto podatkov.
Ključne besede: bibliometrija, Hadoop, HDFS, Microsoft Academic Graph, podatki CORE, porazdeljena obdelava, Spark, velepodatki
Objavljeno: 22.11.2019; Ogledov: 288; Prenosov: 33
.pdf Celotno besedilo (1,93 MB)

2.
Procesiranje finančnih transakcij s programskim ogrodjem Hadoop
David Pandel, 2019, magistrsko delo

Opis: V okviru magistrskega dela je bila izdelana aplikacija, ki omogoča paralelno procesiranje masovnih kartičnih transakcij, t.i. avtorizacij. Programska rešitev temelji na odprtokodnem ogrodju Apache Hadoop, ki je namenjeno obdelovanju velikih količin podatkov (angl. big data). S pristopom Hadoop razbijemo vhodne podatke na več manjših delov, ki se paralelno procesirajo. Hadoop je sestavljen iz dveh glavnih komponent. MapReduce vhodni niz podatkov razdeli na med seboj neodvisne dele, ki se obdelajo paralelno. Datotečni sistem HDFS (angl. Hadoop distributed file system) je bil razvit v programskem jeziku Java in je implementiran za zagotavljanje prilagodljivega in zanesljivega shranjevanja podatkov na več med seboj povezanih računalnikih (angl. clusters of commodity servers). Glavna prednost uporabe Hadoopa je v porazdeljenem sistemu, sestavljenem iz več manj zmogljivih računalnikov in ne le enega zelo zmogljivega. Računalniki se lahko nahajajo na različnih lokacijah, zato ne potrebujemo dodatnega redundantnega sistema, ki služi za samo vzpostavitev sistema v primeru naravne katastrofe.
Ključne besede: Hadoop, HDFS, MapReduce, finančna avtorizacija, ISO8583
Objavljeno: 27.03.2019; Ogledov: 481; Prenosov: 70
.pdf Celotno besedilo (19,34 MB)

3.
PREDSTAVITEV IN UPORABA SISTEMA HADOOP NA WINDOWS SERVER 2012 R2
Sašo Korpič, 2016, diplomsko delo

Opis: V diplomskem delu je predstavljena postavitev strojne in programske opreme za testiranje generiaranja ter sortiranja podatkov treh različnih velikosti. Za strojno opremo smo uporabili strežniški računalnik HP ProLiant DL360 G6. Za glavno programsko opremo pa smo uporabili Windows Server 2012 R2 ter Hadoop verzijo 2.6.4. Na podlagi testiranja smo prišli do rezultatov in sklepa, da se s povečevanjem količine podatkov za sortiranje na enem serverskem računalniku povečuje tudi čas sortiranja podatkov glede na manjše količine podatkov, če bi jih sortirali v enaki količini zapovrstjo.
Ključne besede: Hadoop, Windows Server 2012 R2, TeraSort
Objavljeno: 27.10.2016; Ogledov: 763; Prenosov: 82
.pdf Celotno besedilo (8,12 MB)

4.
TESTIRANJE »ORACLE BIG DATA VM«
Marko Kopač, 2016, diplomsko delo/naloga

Opis: Diplomska naloga obravnava testiranje virtualnega stroja Oracle Big Data Lite (BDL), ki vsebuje že nameščeno demo aplikacijo Movieplex s pripadajočimi podatki. Podana je definicija podatkov in informacij. Predstavljeni so načini shranjevanja in obdelave podatkov. Prikazane so posebnosti manipulacije z masovnimi podatki, ki so tako strukturirani kot tudi nestrukturirani. Opisane so osnove virtualizacije in virtualizacijsko okolje Oracle VirtualBox. Preskušene so izbrane komponente obravnavanega virtualnega stroja in funkcije demo aplikacije Movieplex.
Ključne besede: • Masovni podatki – Big Data • Virtualizacija • Oracle Big Data Lite • Apache Hadoop • Big Data Management System • Oracle Big Data Discovery
Objavljeno: 12.10.2016; Ogledov: 1710; Prenosov: 398
.pdf Celotno besedilo (3,36 MB)

5.
PORAZDELJENA POMENSKA ANALIZA DOKUMENTOV V PROGRAMSKEM OGRODJU APACHE HADOOP
David Starina, 2016, diplomsko delo

Opis: V diplomskem delu obravnavamo porazdeljeno pomensko analizo dokumentov v programskem ogrodju Apache Hadoop. Opišemo sestavo in delovanje Hadoopa, predvsem porazdeljenega datotečnega sistema HDFS in pogajalca za vire YARN. Predstavimo različne metode za pomensko analizo besedil, osredotočimo se na linearno Dirichletovo razporeditev (LDA) in podamo različne metrike za ugotavljanje podobnosti med vektorji. Predstavimo implementacijo rešitve za iskanje podobnih dokumentov s pomočjo programske knjižnice Apache Mahout in razpravljamo o primerih z LDA-jem generiranih tem. Predstavimo rezultate meritev na porazdeljeni in ne-porazdeljeni različici in predstavimo nekaj predlogov za hitrejšo analizo.
Ključne besede: pomenska analiza, porazdeljena obdelava, Hadoop, linearna Dirichletova razporeditev, procesiranje naravnega jezika
Objavljeno: 08.09.2016; Ogledov: 769; Prenosov: 128
.pdf Celotno besedilo (1,33 MB)

6.
COMPARISON OF MYSQL, NEO4J AND APACHE HIVE DATABASE MANAGEMENT SYSTEMS
Matjaž Moser, 2016, magistrsko delo/naloga

Opis: In this work a comparison of three different database management systems (DBMS) is presented. In general a relational data model with a graph data model is compared. The three systems used are MySQL, Neo4j and Apache Hive. Neo4j is a member of the NoSQL database family and is a well-known graph database. The relational databases used in this work are MySQL and Apache Hive. The latter is not a classic relational model but since it is modelled as such it can be considered relational. MySQL is a well-known solution that has been on the market for several years now and is a standard solution for many data problems. Within this work a detailed comparison of all three systems from different aspects of usage is made, both from our own experience as well as from preliminary research from other authors and sources. Additionally some practical information from our dataset with some simple mining techniques is extracted and the result of our work is visualised in an interactive web side using modern approaches to data visualisation.
Ključne besede: Neo4j, MySQL, Apache Hadoop/Hive, database comparison, data visualisation
Objavljeno: 13.05.2016; Ogledov: 1673; Prenosov: 128
.pdf Celotno besedilo (1,02 MB)

7.
POSLOVNI POTENCIAL KONCEPTA BIG DATA
Patricija Gavez, 2013, diplomsko delo

Opis: Informacije predstavljajo neotipljivo premoženje organizacij in so njihova pomembna konkurenčna prednost. Za najboljši izkoristek informacij se organizacije posložujejo poslovnega obveščanja, katerega glavna komponenta so podatkovne baze. Najbolj razširjene podatkovne baze so relacijske baze podatkov, pri katerih so podatki shranjeni v logično povezanih tabelah. Trend povečane rasti količine podatkov je povzročil, da relacijske baze ne uspejo zadovoljiti potreb poslovnega obveščanja. Pojavil se je koncept Big Data in z njim povezane tehnologije za zajem, shranjevanje, obdelavo in izkoristek masovnih količin podatkov. Big Data predstavljajo veliko poslovno priložnost tako za organizacije, ki se jih bodo posluževale pri poslovnem obveščanju, kot tudi za ponudnike programske opreme. Orodje Apache Hadoop, ki vsebuje dve pomembnejši komponenti – MapReduce in HDFS, je le ena izmed prepoznavnejših programskih rešitev na področju koncepta Big Data. Pomembna storitev, ki spada k velikim podatkovnim bazam je tudi računalništvo v oblaku, saj zadovoljuje zahteve s strani infrastrukture, prilagodljivosti storitve pa tudi varstva podatkov.
Ključne besede: Big Data, tehnologije za obvladovanje Big Data, Apache Hadoop, MapReduce, HDFS, poslovno obveščanje, podatkovne baze, relacijske podatkovne baze, integracija podatkov, računalništvo v oblaku
Objavljeno: 04.11.2013; Ogledov: 1694; Prenosov: 384
.pdf Celotno besedilo (974,42 KB)

8.
ANALIZA PRIMEROV UPORABE VELIKE KOLIČINE PODATKOV
Marko Koželj, 2013, diplomsko delo

Opis: Diplomski seminar predstavlja računalništvo v oblaku in velike količine podatkov. Ta dva pojma sta novi poslovni priložnosti za podjetja. Vsekakor bodo brez teh dveh inovacij podjetja težko preživela na mednarodnih trgih. V diplomskem seminarju smo obravnavali računalništvo v oblaku. Na kratko smo povedali osnovne značilnosti, razvoj skozi leta, arhitekturo, tipe in SWOT analizo računalništva v oblaku. Kasneje smo se osredotočili na velike količine podatkov, jih definirali, pojasnili zgodovinski razvoj in ugotavljali ali smo pripravljeni na njih. Razložili smo tudi karakteristike, arhitekturo in ugotavljali praktičnost in uporabnost, ter njihovo varnost. Preučili smo podjetja Google, IBM in Microsoft in ugotovili kakšne rešitve imajo za velike količine podatkov in na kakšni platformi delujejo. Na koncu pa smo še ugotavljali razlike med samo arhitekturo teh rešitev. V glavnem je bila primerjava med rešitvama Dremel in Hadoop. Razložili pa smo tudi zakaj velike količine podatkov pomagajo tem podjetjem.
Ključne besede: Računalništvo v oblaku, velike količine podatkov, Dremel, BigQuery, Hadoop, MapReduce, HDInsight, IBM-ova platforma za velike količine podatkov.
Objavljeno: 23.10.2013; Ogledov: 1214; Prenosov: 109
.pdf Celotno besedilo (1,30 MB)

Iskanje izvedeno v 0.23 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici