| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


1 - 2 / 2
First pagePrevious page1Next pageLast page
1.
2.
IZDELAVA PROGRAMSKEGA PAKETA ZA PRIDOBIVANJE IN PRIMERJANJE BESEDIL IZ INTERNETA
Matej Petek, 2012, undergraduate thesis

Abstract: V diplomskem delu smo obdelali področje pridobivanja dokumentov iz različnih virov na internetu. V teoretičnem delu smo predstavili, kako delujejo spletni pajki, strežniki OAI-PMH in OAI-ORE ter orodje Appache Tika, ki omogoča pretvorbo različnih vrst dokumentov v tekstovno obliko in ekstrakcijo metapodatkov. Zatem smo na kratko predstavili naloge, ki jih rešujejo sistemi za obdelavo besedil v naravnem jeziku. V praktičnem delu smo izdelali programski paket za pridobivanje dokumentov iz interneta in primerjanje besedil iz teh dokumentov.
Keywords: procesiranje naravnega jezika, metapodatki, spletni pajki, OAI-PMH, detekcija plagiatov
Published: 14.03.2012; Views: 2552; Downloads: 189
.pdf Full text (2,57 MB)

Search done in 0.04 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica