| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Izpis gradiva Pomoč

Naslov:Primerjava algoritmov za določanje sopojavnosti besed v besedilih : diplomsko delo
Avtorji:ID Pal, Klemen (Avtor)
ID Holobar, Aleš (Mentor) Več o mentorju... Novo okno
ID Ojsteršek, Milan (Komentor)
ID Ferme, Marko (Komentor)
Datoteke:.pdf UN_Pal_Klemen_2020.pdf (686,66 KB)
MD5: B8D3935BC525C158107EC5314D24BE95
PID: 20.500.12556/dkum/3235ac1c-271e-44c1-b9f0-0c5234552c73
 
Jezik:Slovenski jezik
Vrsta gradiva:Diplomsko delo/naloga
Tipologija:2.11 - Diplomsko delo
Organizacija:FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Opis:Glavna tema diplomske naloge je raziskovanje in primerjava nekaterih najbolj razširjenih algoritmov za določanje sopojavnosti besed v besedilih. Teoretično so razloženi pojavi kolokacij, njihova osnova in statistično ozadje. Nato so opisani trije najpogostejši algoritmi, ki slonijo na različnih pristopih: T-test, Pearsonov hi-kvadrat in algoritem PMI. Ti opisi so podprti s primeri izračuna vrednosti algoritmov. Praktični del vsebuje implementacijo predobdelave besedila in iskanja statističnih podatkov, sledi pa uporaba algoritmov nad temi podatki. Za konec je podana še primerjava teh algoritmov na osnovi dobljenih rezultatov.
Ključne besede:algoritem, sopojavnost besed, besedilo, primerjava
Kraj izida:Maribor
Kraj izvedbe:Maribor
Založnik:[K. Pal]
Leto izida:2020
Št. strani:VI, 43 f.
PID:20.500.12556/DKUM-77700 Novo okno
UDK:004.021:004.912(043.2)
COBISS.SI-ID:38465027 Novo okno
NUK URN:URN:SI:UM:DK:J8Y1WVSF
Datum objave v DKUM:02.11.2020
Število ogledov:850
Število prenosov:52
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
Področja:KTFMB - FERI
:
Kopiraj citat
  
Skupna ocena:(0 glasov)
Vaša ocena:Ocenjevanje je dovoljeno samo prijavljenim uporabnikom.
Objavi na:Bookmark and Share


Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Licence

Licenca:CC BY-NC-ND 4.0, Creative Commons Priznanje avtorstva-Nekomercialno-Brez predelav 4.0 Mednarodna
Povezava:http://creativecommons.org/licenses/by-nc-nd/4.0/deed.sl
Opis:Najbolj omejujoča licenca Creative Commons. Uporabniki lahko prenesejo in delijo delo v nekomercialne namene in ga ne smejo uporabiti za nobene druge namene.
Začetek licenciranja:10.09.2020

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Comparison of word collocation algorithms
Opis:The main subject of this diploma thesis is research and comparison of some of the most common word collocation algorithms. The theoretical part starts off with basic explanation of collocations and statistics. After that each of the three most common algorithms are described: T-test, Pearsons Chi-Squared test and PMI algorithm. Each of them is supported with a calculation example. The practical part consists of text preprocessing and statistical analysis, followed by implementation of these algorithms. The last part of the thesis provides the comparison of the results of these algorithms.
Ključne besede:algorithm, word collocation, text, comparison


Komentarji

Dodaj komentar

Za komentiranje se morate prijaviti.

Komentarji (0)
0 - 0 / 0
 
Ni komentarjev!

Nazaj
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici