Naslov: | Hibridno priporočanje vrstilcev univerzalne decimalne klasifikacije : doktorska disertacija |
---|
Avtorji: | ID Borovič, Mladen (Avtor) ID Strnad, Damjan (Mentor) Več o mentorju...  |
Datoteke: | DOK_Borovic_Mladen_2023.pdf (1,86 MB) MD5: 89BEEA4D282E72CD57FFB12FD55CE0C3
|
---|
Jezik: | Slovenski jezik |
---|
Vrsta gradiva: | Doktorsko delo/naloga |
---|
Tipologija: | 2.08 - Doktorska disertacija |
---|
Organizacija: | FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
|
---|
Opis: | V doktorski disertaciji predlagamo hibridni pristop za priporočanje vrstilcev univerzalne decimalne klasifikacije (UDK) za elektronske dokumente, ne glede na globino hierarhije UDK. Razvit hibridni pristop priporočanja vrstilcev UDK temelji na metodah vsebinskega filtriranja in uporablja strukturirane metapodatke v slovenskem jeziku za klasifikacijo področja znanosti in priporočanje ustreznih vrstilcev. Ker se dokumenti pogosto nanašajo na več področij znanosti, mora biti pristop sposoben identificirati interdisciplinarnost in vrniti več ustreznih vrstilcev UDK. Predlagani hibridni pristop uporablja kaskadno hibridizacijo in je razdeljen na dva kaskadna koraka. Najprej z rangirno funkcijo BM25 zagotovimo začetni seznam vrstilcev UDK. V prvem kaskadnem koraku začetni seznam vrstilcev UDK preuredimo s seznamom, ki je rezultat večznačnega klasifikatorja. Večznačni klasifikator temelji na globoki nevronski mreži BERT in je prilagojen na hierarhično topologijo UDK. V drugem kaskadnem koraku s pomočjo seznama najbolj pogostih vrstilcev UDK v organizaciji, iz katere izvira dokument, preuredimo seznam iz prvega koraka. Za kaskadno hibridizacijo se izvedejo postopki naknadne obdelave, ki preuredijo sezname priporočil glede na vrhnje področje in glede na specifičnost, omogočajo pa tudi rezanje seznama. Disertacija vključuje vrednotenje na množici zaključnih del v slovenskem jeziku, ki so del repozitorijev slovenskih univerz in že imajo ročno določene vrstilce UDK s strani knjižničarjev. Na testni množici dokumentov s predlaganano metodo po metriki HR@K dosežemo povprečne vrednosti 0,574 (K = 1), 0,869 (K = 3) in 0,892 (K = 5). Po metriki NDCG@K dosežemo povprečne vrednosti 0,993 (K = 1), 0,921 (K = 3) in 0,916 (K = 5), po metrikah MRR in MAP pa povprečne vrednosti vrednosti 0,782 (MRR) in 0,785 (MAP). V primerjavi z obstoječimi pristopi pokažemo, da uporaba predlaganega pristopa vodi v statistično značilne izboljšave. |
---|
Ključne besede: | hibridni priporočilni sistemi, univerzalna decimalna klasifikacija, vsebinsko filtriranje, globoke nevronske mreže, obdelava naravnega jezika |
---|
Kraj izida: | Maribor |
---|
Kraj izvedbe: | Maribor |
---|
Založnik: | [M. Borovič] |
---|
Leto izida: | 2023 |
---|
Št. strani: | XVI, 107 str. |
---|
PID: | 20.500.12556/DKUM-84886  |
---|
UDK: | [004.032.26+81'322.2]:025.25UDC(043.3) |
---|
COBISS.SI-ID: | 179494147  |
---|
Datum objave v DKUM: | 04.01.2024 |
---|
Število ogledov: | 579 |
---|
Število prenosov: | 140 |
---|
Metapodatki: |  |
---|
Področja: | KTFMB - FERI
|
---|
:
|
Kopiraj citat |
---|
| | | Skupna ocena: | (0 glasov) |
---|
Vaša ocena: | Ocenjevanje je dovoljeno samo prijavljenim uporabnikom. |
---|
Objavi na: |  |
---|
Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše
podrobnosti ali sproži prenos. |