Abstract: Kolokacije so besedne zveze, ki se v besedilih pojavljajo pogosteje kot bi se po naključju. V diplomskem delu bomo spoznali njihov pomen in uporabo pri procesiranju besedil v slovenskem jeziku. Pogledali si bomo tudi korpus jos1M, ki ga bomo uporabljali kot vhod v algoritme za določanje kolokacij. Implementirali bomo dva algoritma za določanje kolokacij (frekvenčni in razpršeni). Z morfološkim filtriranjem bomo izrazili kolokacije. Na koncu bomo algoritma primerjali. Keywords: procesiranje naravnega jezika, kolokacije, jos1M korpusPublished in DKUM: 30.09.2011; Views: 1991; Downloads: 149 Full text (1,48 MB)