1. Vključitev jezikovnih tehnologij za slovenski jezik v mobilno aplikacijoJaša Glažar, 2025, diplomsko delo Opis: V diplomskem delu smo prikazali vključitev jezikovnih tehnologij v mobilno aplikacijo. Opisali smo jezikovne tehnologije ter njihov razvoj in se osredotočili na avtomatsko prepoznavo govora, strojno prevajanje in sintezo govora. Navedli smo metrike, s katerimi se jezikovne tehnologije vrednotijo, in ustvarili delujoč prototip mobilne aplikacije, v katero smo vključili jezikovne tehnologije. Naredili smo primerjavo treh ponudnikov jezikovnih storitev: Microsoft Azure, Google Cloud Platform in Slovenščina.eu. Rezultati so pokazali, da je storitev Slovenščina.eu najučinkovitejša pri avtomatski prepoznavi govora, Microsoft Azure pri strojnem prevajanju, Google Cloud Platform pa je pri skoraj vseh metrikah dosegel zadnjo mesto. Ključne besede: jezikovne tehnologije, vrednotenje jezikovnih tehnologij, razvoj mobilne aplikacije Objavljeno v DKUM: 03.03.2025; Ogledov: 0; Prenosov: 35
Celotno besedilo (3,10 MB) |
2. Stanje in perspektive uporabe govornih virov v raziskavah govoraMira Krajnc Ivič, 2024, znanstvena monografija Opis: Znanstvena monografija Stanje in perspektive uporabe govornih virov v raziskavah govora predstavlja rezultate prvega leta dela v raziskovalnem projektu Temeljne raziskave za razvoj govornih virov in tehnologij za slovenski jezik (J7-4642) kot tudi rezultate raziskovalcev, ki se ukvarjajo z govorom v drugih raziskovalnih projektih, s skupnim glavnim ciljem strateškega in učinkovitega razvoja prostodostopnih govornih virov. Prispevki izpostavljajo načrte, cilje in izzive ob gradnji govornih virov, in sicer na leksikalni in skladenjski ravni, iščejo rešitve za posebnosti govora na fonetično-fonološki ravni tudi v povezavi s standardi zapisovanja (narečnega) govora. Govor in jezikovna variantnost sta raziskovana kot manifestacija socialne slojevitosti, govorjeni diskurz pa tudi z vidika součinkovanja različnih semiotskih kodov v smislu vzajemnega učinkovanja za tvorjenje smisla sporočila. Z vidika prepletanja prvin govorjenega in pisnega jezika so analizirana izbrana spletna besedila, zanemarjena ni niti vloga govora v gledališki umetnosti. Ključne besede: jezikovne tehnologije, govor, govorjeni diskurz, slovenščina, govorni viri Objavljeno v DKUM: 18.07.2024; Ogledov: 217; Prenosov: 41
Celotno besedilo (13,68 MB) Gradivo ima več datotek! Več... |
3. Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov2023 Opis: Zbornik povzetkov s 6. mednarodne znanstvene konference Slavistični znanstveni premisleki prinaša povzetke uveljavljenih domačih in tujih raziskovalcev in raziskovalk govora in govorjenega diskurza s področij različnih disciplin humanistike, družboslovja in tehničnih ved. Zbrani povzetki prinašajo pregled aktualnega stanja in perspektiv uporabe govornih virov, predstavljene in obravnavane bodo tematike, vezane na različne vrste govorjenega diskurza (npr. politični, narečni, gledališki), na kontekst govorjenega diskurza (npr. sociolingvistika, lingvistika variacij), na pomen in vlogo večpredstavnosti v govorni komunikaciji (npr. pri literarnem branju, v političnem diskurzu). Predstavljene bodo še tematike, vezane na snemanje govora in govorne komunikacije, standarde transkribiranja in vrste korpusnega označevanja, z jezikovno tehnološkega vidita pa še tematike o orodjih za analizo govora in govorne komunikacije. Ključne besede: govorjeni jezik, govorjeni diskurz, jezikovne tehnologije, humanistika, družboslovje Objavljeno v DKUM: 16.05.2023; Ogledov: 589; Prenosov: 62
Celotno besedilo (3,52 MB) Gradivo ima več datotek! Več... |
4. Primerjava metod jezikovnih tehnologij za odkrivanje lažnih novic : magistrsko deloNejc Lovrenčič, 2022, magistrsko delo Opis: Socialna omrežja in tradicionalni viri novic imajo velik vpliv na razmišljanje ter dejanja posameznikov v družbi. Napačna ali izmišljena dejstva in lažne novice lahko zato povzročijo veliko škodo. V sklopu magistrskega dela smo primerjali metode Naivni Bayes, logistično regresijo, nevronsko mrežo z dolgim kratkoročnim spominom in graf konvolucijsko nevronsko mrežo za odkrivanje lažnih novic. S preučitvijo sorodne literature in primerjavo metod smo ugotovili, da je težko prepoznati lažne novice zgolj s klasifikacijo besedila. Pri klasifikaciji novic na dva razreda se je najbolje izkazal logistična regresija, pri klasifikaciji na šest razredov pa nevronska mreža LSTM. Ključne besede: jezikovne tehnologije, nevronske mreže, lažne novice, klasifikacija besedila Objavljeno v DKUM: 11.05.2022; Ogledov: 925; Prenosov: 90
Celotno besedilo (1,36 MB) |
5. Slovenska jezikovna infrastruktura kot jezikovnopolitično vprašanje : potrebe in pričakovanja jezikovnih uporabnikovNina Ledinek, 2018, strokovni članek Opis: V prispevku se s stanjem na področju oblikovanja slovenske jezikovne infrastrukture ukvarjam kot z jezikovnopolitičnim vprašanjem. Prispevek prinaša analizo aktualne pravne, finančne in organizacijske ureditve področja, predstavlja pa tudi ključne izsledke o infrastrukturnih potrebah uporabnikov, kot so bile prepoznane na podlagi analize in interpretacije podatkov iz ankete, izvedene v okviru projekta Jezikovna politika Republike Slovenije in potrebe uporabnikov. Ključne besede: sociolingvistika, jezikovna politika, status jezika, korpus jezika, jezikovni viri, jezikovne tehnologije Objavljeno v DKUM: 11.10.2018; Ogledov: 1980; Prenosov: 96
Celotno besedilo (553,87 KB) Gradivo ima več datotek! Več... |
6. Lektoriranje publicističnih besedil v odnosu do specializiranih jezikovnih tehnologijLea Felicijan, 2016, magistrsko delo Opis: Tema magistrskega dela je lektoriranje, in sicer zlasti kot celostna predstavitev lektorjeve dejavnosti oz. postopka, katerega namen je doseganje jezikovne pravilnosti. Gre za vpogled v lektorsko stroko skozi čas; od začetkov, ko so bili lektorji zgolj začasna rešitev, do danes, ko so v e-dobi nepogrešljiv člen v verigi sooblikovanja jezikovno ustreznega besedila, na poti do jezikovnega svetovanja in uveljavljenega poklica. Delo dokazuje lektorjevo nujno prizadevanje za uresničevanje norme knjižnega jezika, pri čemer mu pripisuje pomembno jezikovnokulturno vlogo; prav lektor je tisti, ki s poznavanjem specializiranih jezikovnih tehnologij vzpostavlja uravnotežen odnos med jezikovno rabo in kodificiranostjo. V teoretičnem delu je opredeljen pojem lektoriranje, razložen postopek računalniškega lektoriranja, predstavljen lektorjev družbeni položaj; poglavje o purizmu kritično ovrednoti pretirano lektorsko skrb za čistost jezika, a se hkrati potrdi teza, da lektorji dobro opravljajo svoje delo; poglavje o jezikovni politiki se dotika kompleksnosti pojma jezikovne pravilnosti, saj se z zagovarjanjem represivnih metod izrekanja glob ob jezikovnih napakah odpira vprašanje o lektorjevi oz. uporabnikovi odgovornosti. Kot posebno pereče pravopisno vprašanje delo zajema tudi poglavje o vejici, v katerem je podana primerjava med Slovenskim pravopisom (1962), Slovenskim pravopisom (2001) in sodobnimi pogledi na to ločilo. Empirični del z analizo raznovrstnih pisnih publicističnih besedil potrjuje vejico kot težavno ločilo; podana je primerjava med lektoriranimi in nelektoriranimi časopisnimi članki – delo strne z ugotovitvijo, da lektor odpravi nemalo jezikovnih napak, zato tvorcem besedil predstavlja nadvse koristno pomoč. Ključne besede: Lektoriranje, jezikovna pravilnost, jezikovne tehnologije, publicistična besedila, vejica. Objavljeno v DKUM: 26.08.2016; Ogledov: 1668; Prenosov: 259
Celotno besedilo (1,89 MB) |
7. SISTEM PRIPOROČANJA DOKUMENTOV IN ANALIZA KVALITETE VSEBINSKEGA PRIPOROČANJA PRI RAZLIČNIH OBDELAVAH VHODNEGA BESEDILAMladen Borovič, 2012, magistrsko delo Opis: V magistrskem delu obravnavamo načrtovanje in razvoj sistemov za vsebinsko priporočanje pomensko sorodnih dokumentov. V teoretičnem delu najprej podamo osnovne značilnosti priporočilnih sistemov. Ker v priporočilnem sistemu obdelujemo besedila v slovenskem jeziku, najprej podamo pregled nekaterih obdelav vhodnega besedila (lematizacija, izločanje pogostih besed in pomensko označevanje). Nato opišemo funkcijo razvrščanja BM25 in pristop z latentno semantično analizo. Sledi podroben opis razvoja priporočilnega sistema, ki je tudi praktični izdelek tega magistrskega dela. V nadaljevanju predstavimo in analiziramo uspešnost vsebinskega priporočanja pri različnih obdelavah vhodnega besedila. Na koncu podamo še nekaj potencialnih izboljšav v smislu pomenskega gručenja, klasifikacije, hibridnega pristopa pri razvrščanju dokumentov in uporabe razvitega sistema v drugih aplikacijah. Ključne besede: priporočilni sistemi, vsebinsko priporočanje dokumentov, funkcija razvrščanja BM25, latentna semantična analiza, beleženje uporabniških aktivnosti, pomensko označevanje, statistične metode, procesiranje naravnega jezika, jezikovne tehnologije Objavljeno v DKUM: 30.11.2012; Ogledov: 3299; Prenosov: 283 (3 glasovi)
Celotno besedilo (2,13 MB) |