1. Samostalniške manjšalnice v korpusu TURKNino Dončec, 2019, master's thesis Abstract: V magistrskem delu Vloga samostalniških manjšalnic v turističnem korpusu TURK preučujemo obliko in pomen manjšalnic, da bi odkrili, kakšno vlogo imajo v turističnih tipih besedil. S pomočjo korpusne analize smo v turističnem korpusu TURK pridobili manjšalnice, ki smo jih najprej delili glede na spol, obrazilo in frekvenco z namenom, da bi dobili natančne podatke o najrodnejših obrazilih in številu pojavitev le-teh. V nadaljevanju smo manjšalnice razporedili glede na pomenska polja, ki smo jih določili s pomočjo skupne uvrščevalne pomenske sestavine (UPS). Ustvarili smo sedem širših pomenskih polj, pri čemer smo vsako izmed njih delili še na ožje pomensko polje. Temeljno urejevalno načelo takega polja je paradigmatsko, saj ga določa UPS (nadpomenka), členi polja pa so razviti s sopomenkami in manjšalnicami, se pravi deli besedne družine, ki ohranjajo UPS. Takšna delitev manjšalnic je bila izbrana z namenom dokazati, da manjšalnice v turističnih besedilih sicer nastopajo v pomenu majhno, ljubko, nedoraslo; ob tem pa nastopajo še v vlogi modifikacijskega argumenta. Keywords: turistični korpus TURK, manjšalnice, obrazila, pomenska polja, korpusni pristop, korpusna analiza, manjšalnice kot modifikacijski argument. Published in DKUM: 10.04.2019; Views: 1293; Downloads: 130 Full text (2,41 MB) |
2. PORAZDELJENA POMENSKA ANALIZA DOKUMENTOV V PROGRAMSKEM OGRODJU APACHE HADOOPDavid Starina, 2016, undergraduate thesis Abstract: V diplomskem delu obravnavamo porazdeljeno pomensko analizo dokumentov v programskem ogrodju Apache Hadoop. Opišemo sestavo in delovanje Hadoopa, predvsem porazdeljenega datotečnega sistema HDFS in pogajalca za vire YARN. Predstavimo različne metode za pomensko analizo besedil, osredotočimo se na linearno Dirichletovo razporeditev (LDA) in podamo različne metrike za ugotavljanje podobnosti med vektorji. Predstavimo implementacijo rešitve za iskanje podobnih dokumentov s pomočjo programske knjižnice Apache Mahout in razpravljamo o primerih z LDA-jem generiranih tem. Predstavimo rezultate meritev na porazdeljeni in ne-porazdeljeni različici in predstavimo nekaj predlogov za hitrejšo analizo. Keywords: pomenska analiza, porazdeljena obdelava, Hadoop, linearna Dirichletova razporeditev, procesiranje naravnega jezika Published in DKUM: 08.09.2016; Views: 1482; Downloads: 170 Full text (1,33 MB) |
3. Besednovrstna in pomenska analiza neobdelanih besed iz kartoteke Slovarja slovenskega knjižnega jezika in Besedišča slovenskega jezika (od babako do bebop)Katja Klačinski, 2011, undergraduate thesis Abstract: Slovensko besedje so v preteklosti jezikoslovci zbirali in dopolnjevali ter izdali v mnogih splošnih in strokovnih slovarjih. V teoretičnem delu diplomske naloge sem se osredotočila na predstavitev pomembnejših slovarjev slovenskega knjižnega jezika in jezikovnih korpusov. Temelj vseh je še danes Slovar slovenskega knjižnega jezika, ki je bil najprej izdan v petih knjigah, kasneje v eni sami; zadnja verzija tega slovarja pa je v elektronski izdaji. Podrobneje me je zanimalo slovensko besedje po izdaji Slovarja slovenskega knjižnega jezika, pri čemer je zajeto besedje v obdobju zadnjih dvajsetih let, t. i. novejša leksika. Primerjanje novejše slovenske leksike z novejšo leksiko slovanskih narodov z vidika obdelovanja in zbiranja novejšega leksikografskega gradiva me je vodilo k vrednotenju slovenskega napredka. Cilj praktičnega dela diplomske naloge je bila besednovrstna in pomenska obdelava besed iz kartoteke za izdelavo slovarja slovenskega knjižnega jezika, ki še niso bile uporabljene, obdelane in vknjižene. Pri raziskovanju informacij v teoretičnem delu in pri analizi besed v praktičnem delu diplomskega dela sem uporabila razne metode, in sicer deskriptivne in komparativne metode v teoretičnem delu, metodo klasifikacije pa v praktičnem delu. Raziskovala sem s pomočjo raznih monografij, člankov iz slovenskih in tujih znanstvenih revij, s pomočjo jezikovnih korpusov, slovarjev in spleta. Zaradi primernih raziskovalnih metod in uporabljenih virov je analiza besed v praktičnem delu obdelana kvalitetno in po pravilih slovaropisja. Pomenska razlaga besed je strokovno in jasno zapisana, prav tako tudi slovnična dopolnila. Informacije o novejši slovenski in slovanski leksiki so v grobem zbrane na enem mestu in predstavljajo lažji vpogled v trenutno stanje novejšega besedja pri nas in drugod. Keywords: Slovarji in zbirke slovenskega besedja, jezikovni korpusi, novejša slovenska leksika, novejša slovanska leksika, besednovrstna in pomenska analiza besed na črko b. Published in DKUM: 07.11.2011; Views: 3599; Downloads: 247 Full text (666,56 KB) |