1. Uporaba evolucijskih algoritmov v statističnem in hibridnem strojnem prevajanju : doctoral dissertationJani Dugonik, 2025, doctoral dissertation Abstract: Doktorska disertacija obravnava področje strojnega prevajanja visoko fleksibilnih jezikov, osredotoča pa se na izzive tako statističnega kot nevronskega strojnega prevajanja, ki jih prinašajo strukturne razlike med visoko fleksibilnimi jeziki in angleščino. Naša raziskava vključuje tudi eksperimentalni del, izveden na jezikovnem paru \mbox{slovenščina--angleščina}, ki zajema prevajanje v obe smeri. V prvem eksperimentu smo načrtovali nov pristop za optimizacijo parametrov v statističnem strojnem prevajanju z uporabo evolucijskih algoritmov. Primerjali smo sisteme statističnega strojnega prevajanja, optimizirane s klasičnimi algoritmi za optimizacijo uteži v statističnem strojnem prevajanju, in sisteme, optimizirane z evolucijskimi algoritmi. V drugem eksperimentu pa smo načrtovali in razvili hibridni pristop, ki vključuje sisteme statističnega in nevronskega strojnega prevajanja. Izvorno poved in dva ciljna prevoda, prevedena z obema sistemoma, smo pretvorili v isti vektorski prostor, iz katerega smo nato pridobili vektorje značilk. V okviru doktorske disertacije smo pred\-lagali nov nabor značilk. Z uporabo klasifikatorjev smo nato izbrali boljšega izmed dveh prevodov, statističnega in nevronskega. Evalvacijo sistemov strojnega prevajanja smo izvedli z uporabo uveljavljenih metrik, kot so BLEU, TER, chrF in COMET. Opravili smo statistično analizo eksperimentalnih rezultatov s ponovnim vzorčenjem, ki je pokazala statistično pomembne razlike v kakovosti ustvarjenih prevodov. Eksperimentalni rezultati potrjujejo, da smo s predlaganimi pristopi izboljšali kakovost strojnih prevodov. Keywords: evolucijski algoritem, statistično strojno prevajanje, nevronsko strojno prevajanje, hibridni pristop strojnega prevajanja, optimizacija, predstavitev besed, klasifikacija, obratno prevajanje Published in DKUM: 29.01.2025; Views: 0; Downloads: 30
Full text (1,21 MB) |
2. Action-Based Digital Characterization of a Game PlayerDamijan Novak, Domen Verber, Jani Dugonik, Iztok Fister, 2023, original scientific article Keywords: association rule mining, digital characterization, game agent, game player, real-time strategy games Published in DKUM: 23.05.2024; Views: 131; Downloads: 8
Full text (9,40 MB) This document has many files! More... |
3. Reduction of Neural Machine Translation Failures by Incorporating Statistical Machine TranslationJani Dugonik, Mirjam Sepesy Maučec, Domen Verber, Janez Brest, 2023, original scientific article Abstract: This paper proposes a hybrid machine translation (HMT) system that improves the quality of neural machine translation (NMT) by incorporating statistical machine translation (SMT). Therefore, two NMT systems and two SMT systems were built for the Slovenian-English language pair, each for translation in one direction. We used a multilingual language model to embed the source sentence and translations into the same vector space. From each vector, we extracted features based on the distances and similarities calculated between the source sentence and the NMT translation, and between the source sentence and the SMT translation. To select the best possible translation, we used several well-known classifiers to predict which translation system generated a better translation of the source sentence. The proposed method of combining SMT and NMT in the hybrid system is novel. Our framework is language-independent and can be applied to other languages supported by the multilingual language model. Our experiment involved empirical applications. We compared the performance of the classifiers, and the results demonstrate that our proposed HMT system achieved notable improvements in the BLEU score, with an increase of 1.5 points and 10.9 points for both translation directions, respectively. Keywords: neural machine translation, statistical machine translation, sentence embedding, similarity, classification, hybrid machine translation Published in DKUM: 20.02.2024; Views: 322; Downloads: 32
Full text (400,40 KB) This document has many files! More... |
4. Uglaševanje parametrov pri statističnem strojnem prevajanjuJani Dugonik, 2013, master's thesis Abstract: V magistrskem delu se bomo osredotočili na uglaševanje sistema za strojno prevajanje. V okviru tega bomo vzpostavili sistem za strojno prevajanje, ki temelji na statističnih modelih. Omejili se bomo na prevajanje iz slovenščine v angleščino. Rezultate bomo ocenili z metriko BLEU. Pričakujemo, da bo naš pristop primerljiv z ostalimi metodami. Keywords: strojno prevajanje, statistično strojno prevajanje, jezikovni model, evolucijski algoritem, uteži, uglaševanje, optimizacija Published in DKUM: 11.07.2013; Views: 2870; Downloads: 214
Full text (1,28 MB) |
5. JAVASCRIPT OGRODJE GOOGLE WEB TOOLKITJani Dugonik, 2010, bachelor thesis/paper Abstract: V diplomski nalogi predstavljamo delovanje in osnovne funkcije Javascript ogrodja Google Web Toolkit. Predstavimo tudi nov protokol za delo s klici oddaljenih podprogramov,. delovanje žetonov za podporo zaznavanju zgodovine brskanja in tvorjenju zaznamkov ter podporo večjezičnosti uporabniškega vmesnika spletnih aplikacij. V praktičnem delu smo izdelali spletno aplikacijo, v kateri prikažemo delovanje nekaterih gradnikov, ki jih omogoča ogrodje. Keywords: JavaScript ogrodje, Java, Google Web Toolkit, GWT, RPC, AJAX Published in DKUM: 16.03.2011; Views: 2994; Downloads: 226
Full text (1,85 MB) |