| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Izpis gradiva Pomoč

Naslov:Razvoj modela za inteligentno podporo odločanju na osnovi analize nesktrukturiranih vsebin
Avtorji:ID Pavlinek, Miha (Avtor)
ID Podgorelec, Vili (Mentor) Več o mentorju... Novo okno
Datoteke:.pdf EDOK_Pavlinek_Miha_2016.pdf (4,13 MB)
MD5: 227474E7DBE4920EB6534E1E376FFBDC
 
Jezik:Slovenski jezik
Vrsta gradiva:Doktorska disertacija
Tipologija:2.08 - Doktorska disertacija
Organizacija:FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Opis:V svetu vseprisotnega računalništva se s kopičenjem naprav ter množično uporabo družbenih omrežij, elektronske komunikacije in drugih oblik IKT storitev naglo povečuje tudi količina nestrukturiranih vsebin. To nas sili k uporabi inteligentnih rešitev, ki za nas te vsebine organizirajo, se namesto nas odločajo o njihovi pomembnosti in nam posredujejo zgolj najbolj relevantne med njimi. Osnovna zmožnost takšnih rešitev je klasifikacija vsebin, zato so v njih avtomatski klasifikatorji nepogrešljiv člen. Zanje je tipično, da za učenje potrebujejo številne označene primerke z ustrezno predstavitvijo, v praksi pa označeni primerki niso vedno na voljo, zato je potrebno avtomatske klasifikatorje prilagoditi tako, da so sposobni pri učenju uporabljati tudi druge, neoznačene vsebine. V disertaciji smo predstavili metodo ST LDA (ang. Self-Training with LDA) za klasifikacijo besedil, ki za učenje klasifikatorja potrebuje le minimalno množico označenih in veliko večjo množico neoznačenih primerkov. Predlagali smo algoritem, ki temelji na metodi samoučenja ter predstavitvi besedil na osnovi tematskega modela, kar prinaša dodatne faktorje, od katerih je odvisna njegova uspešnost. Za vsak faktor smo, na podlagi številnih eksperimentov nad sedmimi besedilnimi podatkovnimi zbirkami, ocenili vpliv na uspešnost klasifikacije ter definirali model za določanje vrednosti parametrov, s čimer se izognemo dodatnim nastavitvam. Uspešnost metode smo primerjali z uspešnostjo drugih uveljavljenih metod in predstavitev, pri čemer predlagana metoda ST LDA dosega nadpovprečne rezultate, kar smo navsezadnje potrdili z neparametričnimi statističnimi testi.
Ključne besede:obdelava naravnega jezika, tekstovno rudarjenje, klasifikacija, tematsko modeliranje, delno nadzorovano učenje, samoučenje
Kraj izida:Maribor
Založnik:[M. Pavlinek]
Leto izida:2016
PID:20.500.12556/DKUM-61829 Novo okno
UDK:004.89:316,472.4(043.3)
COBISS.SI-ID:19820310 Novo okno
NUK URN:URN:SI:UM:DK:BQ7WUAOA
Datum objave v DKUM:16.09.2016
Število ogledov:2162
Število prenosov:218
Metapodatki:XML DC-XML DC-RDF
Področja:KTFMB - FERI
:
PAVLINEK, Miha, 2016, Razvoj modela za inteligentno podporo odločanju na osnovi analize nesktrukturiranih vsebin [na spletu]. Doktorska disertacija. Maribor : M. Pavlinek. [Dostopano 10 april 2025]. Pridobljeno s: https://dk.um.si/IzpisGradiva.php?lang=slv&id=61829
Kopiraj citat
  
Skupna ocena:
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
(0 glasov)
Vaša ocena:Ocenjevanje je dovoljeno samo prijavljenim uporabnikom.
Objavi na:Bookmark and Share


Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Development of an intelligent decision support model based on unstructured content analysis
Opis:In a world of ubiquitous computing, with an explosion in the availability of devices and the widespread use of social networks, electronic communications and other forms of ICT services, unstructured content has been rapidly increasing. This forces us to use intelligent systems to organize our content, make decisions about their importance and recommend only the most relevant among them. The core characteristic of such systems is the ability to classify content. Therefore, automatic classifiers play an indispensable role. They are usually limited to supervised learning, where all the data is labeled. In practice, however, labeled examples are not always available, so it is necessary to adapt classifiers to learn from both labeled and unlabeled data. In this dissertation, we propose a Self-Training with LDA (ST LDA) method for text classification in the presence of a minimal amount of labeled data and a much larger set of unlabeled data. It is based on a self-training method and text representation based on topic models, which brings additional factors that affect method’s performance. The influence of each factor was estimated via several variations of the experiment over seven datasets and according to achievements, we developed a general model with which every parameter can be precisely defined for any given collection. The performance of the method is compared with other state-of-the-art methods and methods based on typical representations. It turned out that ST LDA outperforms other compared methods and variations. This was additionally confirmed with nonparametric statistical tests.
Ključne besede:natural language processing, text mining, classification, topic modeling, semi-supervised learning, self-training


Komentarji

Dodaj komentar

Za komentiranje se morate prijaviti.

Komentarji (0)
0 - 0 / 0
 
Ni komentarjev!

Nazaj
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici