Title: | IZDELAVA PROGRAMSKEGA PAKETA ZA PRIDOBIVANJE IN PRIMERJANJE BESEDIL IZ INTERNETA |
---|
Authors: | ID Petek, Matej (Author) ID Ojsteršek, Milan (Mentor) More about this mentor...  |
Files: | UNI_Petek_Matej_2012.pdf (2,57 MB) MD5: EFF8D4807FE6C586BA832553EC91C774 PID: 20.500.12556/dkum/bd644252-09b2-4f25-87b6-1220190add48
|
---|
Language: | Slovenian |
---|
Work type: | Undergraduate thesis |
---|
Typology: | 2.11 - Undergraduate Thesis |
---|
Organization: | FERI - Faculty of Electrical Engineering and Computer Science
|
---|
Abstract: | V diplomskem delu smo obdelali področje pridobivanja dokumentov iz različnih virov na internetu. V teoretičnem delu smo predstavili, kako delujejo spletni pajki, strežniki OAI-PMH in OAI-ORE ter orodje Appache Tika, ki omogoča pretvorbo različnih vrst dokumentov v tekstovno obliko in ekstrakcijo metapodatkov. Zatem smo na kratko predstavili naloge, ki jih rešujejo sistemi za obdelavo besedil v naravnem jeziku. V praktičnem delu smo izdelali programski paket za pridobivanje dokumentov iz interneta in primerjanje besedil iz teh dokumentov. |
---|
Keywords: | procesiranje naravnega jezika, metapodatki, spletni pajki, OAI-PMH, detekcija plagiatov |
---|
Place of publishing: | Maribor |
---|
Publisher: | [M. Petek] |
---|
Year of publishing: | 2012 |
---|
PID: | 20.500.12556/DKUM-22262  |
---|
UDC: | 004.774.6(043.2) |
---|
COBISS.SI-ID: | 16168470  |
---|
NUK URN: | URN:SI:UM:DK:HAIAZ9MM |
---|
Publication date in DKUM: | 14.03.2012 |
---|
Views: | 3419 |
---|
Downloads: | 264 |
---|
Metadata: |  |
---|
Categories: | KTFMB - FERI
|
---|
:
|
Copy citation |
---|
| | | Average score: | (0 votes) |
---|
Your score: | Voting is allowed only for logged in users. |
---|
Share: |  |
---|
Hover the mouse pointer over a document title to show the abstract or click
on the title to get all document metadata. |