| Title: | IZDELAVA PROGRAMSKEGA PAKETA ZA PRIDOBIVANJE IN PRIMERJANJE BESEDIL IZ INTERNETA |
|---|
| Authors: | ID Petek, Matej (Author) ID Ojsteršek, Milan (Mentor) More about this mentor...  |
| Files: | UNI_Petek_Matej_2012.pdf (2,57 MB) MD5: EFF8D4807FE6C586BA832553EC91C774 PID: 20.500.12556/dkum/bd644252-09b2-4f25-87b6-1220190add48
|
|---|
| Language: | Slovenian |
|---|
| Work type: | Undergraduate thesis |
|---|
| Typology: | 2.11 - Undergraduate Thesis |
|---|
| Organization: | FERI - Faculty of Electrical Engineering and Computer Science
|
|---|
| Abstract: | V diplomskem delu smo obdelali področje pridobivanja dokumentov iz različnih virov na internetu. V teoretičnem delu smo predstavili, kako delujejo spletni pajki, strežniki OAI-PMH in OAI-ORE ter orodje Appache Tika, ki omogoča pretvorbo različnih vrst dokumentov v tekstovno obliko in ekstrakcijo metapodatkov. Zatem smo na kratko predstavili naloge, ki jih rešujejo sistemi za obdelavo besedil v naravnem jeziku. V praktičnem delu smo izdelali programski paket za pridobivanje dokumentov iz interneta in primerjanje besedil iz teh dokumentov. |
|---|
| Keywords: | procesiranje naravnega jezika, metapodatki, spletni pajki, OAI-PMH, detekcija plagiatov |
|---|
| Place of publishing: | Maribor |
|---|
| Publisher: | [M. Petek] |
|---|
| Year of publishing: | 2012 |
|---|
| PID: | 20.500.12556/DKUM-22262  |
|---|
| UDC: | 004.774.6(043.2) |
|---|
| COBISS.SI-ID: | 16168470  |
|---|
| NUK URN: | URN:SI:UM:DK:HAIAZ9MM |
|---|
| Publication date in DKUM: | 14.03.2012 |
|---|
| Views: | 3419 |
|---|
| Downloads: | 271 |
|---|
| Metadata: |  |
|---|
| Categories: | KTFMB - FERI
|
|---|
|
:
|
Copy citation |
|---|
| | | | Average score: | (0 votes) |
|---|
| Your score: | Voting is allowed only for logged in users. |
|---|
| Share: |  |
|---|
Hover the mouse pointer over a document title to show the abstract or click
on the title to get all document metadata. |