| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


1 - 1 / 1
First pagePrevious page1Next pageLast page
1.
Primerjava algoritmov za določanje sopojavnosti besed v besedilih
Klemen Pal, 2020, undergraduate thesis

Abstract: Glavna tema diplomske naloge je raziskovanje in primerjava nekaterih najbolj razširjenih algoritmov za določanje sopojavnosti besed v besedilih. Teoretično so razloženi pojavi kolokacij, njihova osnova in statistično ozadje. Nato so opisani trije najpogostejši algoritmi, ki slonijo na različnih pristopih: T-test, Pearsonov hi-kvadrat in algoritem PMI. Ti opisi so podprti s primeri izračuna vrednosti algoritmov. Praktični del vsebuje implementacijo predobdelave besedila in iskanja statističnih podatkov, sledi pa uporaba algoritmov nad temi podatki. Za konec je podana še primerjava teh algoritmov na osnovi dobljenih rezultatov.
Keywords: algoritem, sopojavnost besed, besedilo, primerjava
Published: 02.11.2020; Views: 95; Downloads: 13
.pdf Full text (686,66 KB)

Search done in 0.04 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica