| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Izpis gradiva Pomoč

Naslov:Extracting terminologically relevant collocations from texts on informatics
Avtorji:ID Gmeiner, Primož (Avtor)
ID Plemenitaš, Katja (Mentor) Več o mentorju... Novo okno
Datoteke:.pdf UNI_Gmeiner_Primoz_2010.pdf (914,91 KB)
MD5: 25C281BC48AC5DCCF6F3024EE4F1DBE6
PID: 20.500.12556/dkum/23efa0d1-ff78-44a6-8bec-f4bdbe9a248d
 
Jezik:Angleški jezik
Vrsta gradiva:Diplomsko delo
Organizacija:FF - Filozofska fakulteta
Opis:The diploma thesis discusses the methodology behind the extraction of terminologically relevant collocations from texts on informatics, particularly from the special subject domain of electronic government. The theoretical framework presents a network of scientific fields crucial in understanding of basic facts surrounding the collocation extraction. Empirical part of the thesis, however, is a more hands-on approach describing how the extraction is performed in practice. Key aspects of the research are presented in an orderly fashion. A hybrid method of syntactic pattern filtering and statistical calculations is presented. It is divided into several stages and described in detail. The scale of the research included extraction method, data import, statistical analysis, corpora analysis and glossary-building. The research was carried out in a semi-automatic way, i.e. some work was done manually, while everything else was computer-assisted. The glossary created is an alphabetical word-list of two-word terminological collocations accompanied by their Slovene equivalents and definitions. It is a basic construct that can later on enable me to supplement the existing two-word units with the expansion of their n-grams, thus creating a glossary with multi-word units the collocation extraction has provided me with.
Ključne besede:terminološke kolokacije (sopojavljanke), luščenje strokovnega izrazja z upoštevanjem kolokacij (sopojavljank), hibridna metoda, skladenjski vzorci, korpusna analiza, glosar (razlagalni slovar), elektronska uprava
Kraj izida:Maribor
Založnik:[P. Gmeiner]
Leto izida:2010
PID:20.500.12556/DKUM-14232 Novo okno
UDK:811.111'25(043.2):004
COBISS.SI-ID:17788680 Novo okno
NUK URN:URN:SI:UM:DK:DLG9M4VK
Datum objave v DKUM:23.07.2010
Število ogledov:2611
Število prenosov:233
Metapodatki:XML DC-XML DC-RDF
Področja:FF
:
GMEINER, Primož, 2010, Extracting terminologically relevant collocations from texts on informatics [na spletu]. Diplomsko delo. Maribor : P. Gmeiner. [Dostopano 20 januar 2025]. Pridobljeno s: https://dk.um.si/IzpisGradiva.php?lang=slv&id=14232
Kopiraj citat
  
Skupna ocena:
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
(0 glasov)
Vaša ocena:Ocenjevanje je dovoljeno samo prijavljenim uporabnikom.
Objavi na:Bookmark and Share


Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Sekundarni jezik

Jezik:Slovenski jezik
Naslov:Luščenje strokovnega izrazja z upoštevanjem kolokacij iz besedil s področja informatike
Opis:V diplomskem delu je obravnavana metoda luščenja strokovnega izrazja z upoštevanjem kolokacij iz besedil s področja informatike, natančneje na temo elektronske uprave. Teoretični del je splet različnih področij znanosti, ki so ključna za razumevanje osnovnih dejstev, ki zadevajo luščenje izrazja. Empirični del posreduje pristop, kako se je luščenja izrazja treba lotiti v praksi. Ključni vidiki raziskave si sledijo v predvidenem pravilnem vrstnem redu. Uporabljena je hibridna metoda, ki vključuje določene skladenjske vzorce in statistične izračune. Metoda je večstopenjsko opredeljena in podrobno opisana. Raziskava obsega luščenje izrazja, vnos podatkov, statistično obravnavo, korpusno obravnavo in izdelavo glosarja. Raziskava je terjala veliko ročne obdelave podatkov, precej sem si pomagal z računalniško podprtimi programi. Nastali glosar vsebuje abecedni seznam dvobesednih kolokacij s slovenskimi ustreznicami in razlagami. Predstavlja osnovni sestav dvobesednih enot in možnost nadaljnjega raziskovanja, saj lahko obstoječim kolokacijam razširimo njihov trenutni n-gram, in s tem povečamo glosar z večbesednimi enotami, predhodno izluščenimi iz besedil.
Ključne besede:terminological collocations, collocation extraction, hybrid method, syntactic patterns, corpora analysis, glossary, electronic government


Komentarji

Dodaj komentar

Za komentiranje se morate prijaviti.

Komentarji (0)
0 - 0 / 0
 
Ni komentarjev!

Nazaj
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici