| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Izpis gradiva Pomoč

Naslov:IZDELAVA PROGRAMSKEGA PAKETA ZA PRIDOBIVANJE IN PRIMERJANJE BESEDIL IZ INTERNETA
Avtorji:ID Petek, Matej (Avtor)
ID Ojsteršek, Milan (Mentor) Več o mentorju... Novo okno
Datoteke:.pdf UNI_Petek_Matej_2012.pdf (2,57 MB)
MD5: EFF8D4807FE6C586BA832553EC91C774
PID: 20.500.12556/dkum/bd644252-09b2-4f25-87b6-1220190add48
 
Jezik:Slovenski jezik
Vrsta gradiva:Diplomsko delo
Tipologija:2.11 - Diplomsko delo
Organizacija:FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Opis:V diplomskem delu smo obdelali področje pridobivanja dokumentov iz različnih virov na internetu. V teoretičnem delu smo predstavili, kako delujejo spletni pajki, strežniki OAI-PMH in OAI-ORE ter orodje Appache Tika, ki omogoča pretvorbo različnih vrst dokumentov v tekstovno obliko in ekstrakcijo metapodatkov. Zatem smo na kratko predstavili naloge, ki jih rešujejo sistemi za obdelavo besedil v naravnem jeziku. V praktičnem delu smo izdelali programski paket za pridobivanje dokumentov iz interneta in primerjanje besedil iz teh dokumentov.
Ključne besede:procesiranje naravnega jezika, metapodatki, spletni pajki, OAI-PMH, detekcija plagiatov
Kraj izida:Maribor
Založnik:[M. Petek]
Leto izida:2012
PID:20.500.12556/DKUM-22262 Novo okno
UDK:004.774.6(043.2)
COBISS.SI-ID:16168470 Novo okno
NUK URN:URN:SI:UM:DK:HAIAZ9MM
Datum objave v DKUM:14.03.2012
Število ogledov:3419
Število prenosov:264
Metapodatki:XML DC-XML DC-RDF
Področja:KTFMB - FERI
:
Kopiraj citat
  
Skupna ocena:(0 glasov)
Vaša ocena:Ocenjevanje je dovoljeno samo prijavljenim uporabnikom.
Objavi na:Bookmark and Share


Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Sekundarni jezik

Jezik:Angleški jezik
Naslov:CREATING A SOFTWARE PACKAGE FOR ACQUIRING AND COMPARING OF TEXTS FROM THE INTERNET
Opis:In my diploma work we dealt with the area of acquiring documents from various sources on the internet. In the theoretical part we represented the work of web crowlers, servers OAI-PMH and OAI-ORE and Appache Tika tool which enables conversion of various kinds of documents into text form and extraction of metadata. Secondly, we shortly represented the tasks which are solved by systems for processing of natural language texts. In the practical part we built a software package for acquiring and comparing documents from the internet.
Ključne besede:natural language processing, metadata, web spider, OAI-PMH, plagiat detection


Komentarji

Dodaj komentar

Za komentiranje se morate prijaviti.

Komentarji (0)
0 - 0 / 0
 
Ni komentarjev!

Nazaj
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici